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BLASTN 2.2.19+ 

Reference: Zheng Zhang, Scott Schwartz, Lukas Wagner, and 
Webb Miller (2000), "A greedy algorithm for aligning DNA 
sequences", J Comput Biol 2000; 7 ( 1-2 ): 203-14 . 

RID: URU3KT33016 

Database: Nucleotide sequences derived from the Patent division of 
GenBank 

8,753,385 sequences; 4,832,233,817 total letters 
Query= SID_3 
Length=2660 

Score E 

Sequences producing significant alignments: (Bits) Value 

dbj |DI129697.1| AN EXPRESSION CASSETTE AND VECTOR FORTRANS IEN . . . 4817 0.0 

dbj |DI109112.1| FLP-mediated Recombination 4817 0.0 

dbj | DJ052243 . 1 | FLP-mediated Recombination 4817 0.0 

dbj | DD418156 . 1 | AN EXPRESSION CASSETTE AND VECTOR FOR TRANS IE . . . 4817 0.0 

dbj | E00140 . 1 | Genomic DNA encoding human growth hormone 4795 0.0 

emb | AX719120 . 1 | Sequence 1 from Patent EP1295938 4724 0.0 

emb|AX659146.1| Sequence 1 from Patent WO02101002 4724 0.0 

emb I CS741886 . 1 | Sequence 9882 from Patent WO2005083127 4684 0.0 

emb|CS741885.1| Sequence 9881 from Patent WO2005083127 4684 0.0 

gb|GC699295.1| Sequence 14540 from patent US 6812339 2802 0.0 

gb|GC699294.1| Sequence 14539 from patent US 6812339 2802 0.0 

gb|GC699293.1| Sequence 14538 from patent US 6812339 2802 0.0 

gb|GC699292.1| Sequence 14537 from patent US 6812339 2802 0.0 

gb|GC699291.1| Sequence 14536 from patent US 6812339 2802 0.0 

gb|GC699290.1| Sequence 14535 from patent US 6812339 2802 0.0 

gb|GC699289.1| Sequence 14534 from patent US 6812339 2802 0.0 

gb|GC699288.1| Sequence 14533 from patent US 6812339 2802 0.0 

gb|GC699287.1| Sequence 14532 from patent US 6812339 2802 0.0 

gb|GC699286.1| Sequence 14531 from patent US 6812339 2802 0.0 

gb|GC699285.1| Sequence 14530 from patent US 6812339 2802 0.0 

gb|GC699284.1| Sequence 14529 from patent US 6812339 2802 0.0 

gb|GC699283.1| Sequence 14528 from patent US 6812339 2802 0.0 

gb|GC699282.1| Sequence 14527 from patent US 6812339 2802 0.0 

gb|GC699281.1| Sequence 14526 from patent US 6812339 2802 0.0 

gb|GC699280.1| Sequence 14525 from patent US 6812339 2802 0.0 

gb|GC699279.1| Sequence 14524 from patent US 6812339 2802 0.0 

gb|GC699278.1| Sequence 14523 from patent US 6812339 2802 0.0 

gb|GC699277.1| Sequence 14522 from patent US 6812339 2802 0.0 

gb|GC699276.1| Sequence 14521 from patent US 6812339 2802 0.0 

emb|FB669399.1| Sequence 44 from Patent WO2007144105 2796 0.0 

dbj | DI131946 . 1 | Growth Hormone Variation in Humans and its uses 2796 0.0 

emb|CS694111.1| Sequence 25 from Patent WO2007077422 2796 0.0 

emb|CS694086.1| Sequence 7 from Patent WO2007077423 2796 0.0 

dbj | DD441736 . 1 | Growth Hormone Variation in Humans and its uses 2796 0.0 

dbj | DD211379 . 1 | New Mutations 2796 0.0 

emb | CQ818162 . 1 | Sequence 1 from Patent WO2004044002 2796 0.0 

emb | AX767318 . 1 | Sequence 1 from Patent WO03042245 2796 0.0 

emb | AX512768 . 1 | Sequence 2 from Patent EP1233063 2793 0.0 

dbj | DD164250 . 1 | Single Nucleotide Polymorphisms in GH-1 2776 0.0 

gb| 141411. 1 | 141411 Sequence 5 from patent US 5625124 2702 0.0 

gb | AR134712 . 1 | AR134712 Sequence 9 from patent US 6194176 2625 0.0 
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gb| AR108064. 1 | AR108064 Sequence 9 from patent US 6110707 


2625 


0 


0 


gb| AR102885. 1 | AR102885 Sequence 9 from patent US 6087129 


2625 


0 


0 


dbj | DI105645 . 1 | 


Expression system 


2135 


0 


0 


dbj | DD292520 . 1 | 


GENE EXPRESSION SYSTEM BASED ON CODON TRANSLA. . 


2135 


0 


0 


dbj | DI013548 . 1 | 


PHAGE-DEPENDENT SUPER PRODUCTION OF BIOLOGICA. . 


2102 


0 


0 


emb|CS491929.1| 


Sequence 2 from Patent WO2007018583 


2102 


0 


0 


dbj IDD080951.il 


PHAGE-DEPENDENT SUPERPRODUCTION OF BIOLOGICAL.. 


2102 


0 


0 


gb|AR575651.1| 


Sequence 8 from patent US 6773899 


2102 


0 


0 


dbj IDM033602.il 


CONJUGATES OF BIOLOGICALLY ACTIVE PROTEINS HA. . 


2091 


0 


0 


emb|CS704166.1| 


Sequence 2473 from Patent WO2006081249 


2091 


0 


0 


gb|AR119909.1|AR119909 Sequence 1 from patent US 6153427 


2091 


0 


0 


gb|AR794573.1| 


Sequence 17 from patent US 6998472 


2060 


0 


0 


dbj IBD235612.il 


Gene 


2060 


0 


0 


dbj IDI105163.il 


Expression system 


1969 


0 


0 


dbj | DD292521 . 1 | 


GENE EXPRESSION SYSTEM BASED ON CODON TRANSLA. . 


1969 


0 


0 


dbj | DD373892 . 1 | 


METHODS FOR DIAGNOSING RCC AND OTHER SOLID TU . . 


1923 


0 


0 


emb|CS732094.1| 


Sequence 90 from Patent WO2005083127 


1797 


0 


0 


gb | AR108119 . 1 | AR108119 Sequence 72 from patent US 6110707 


1731 


0 


0 


gb|AR108118.1|AR108118 Sequence 70 from patent US 6110707 


1731 


0 


0 


gb| 102855.11 Sequence 1 from Patent US 4446235 


1511 


0 


0 


gb|l02856.1| Sequence 2 from Patent US 4446235 


1339 


0 


0 


dbj IDL066432.il 


Cancer Gene Determination and Therapeutic Scr.. 


1308 


0 


0 


emb|AX335036.1| 


Sequence 5545 from Patent WO0194629 


1308 


0 


0 


emb|CS732112.1| 


Sequence 108 from Patent WO2005083127 


1301 


0 


0 


emb|CS732114.1| 


Sequence 110 from Patent WO2005083127 


1242 


0 


0 


emb|CS732113.1| 


Sequence 109 from Patent WO2005083127 


1238 


0 


0 


emb|CS732104.1| 


Sequence 100 from Patent WO2005083127 


1238 


0 


0 


emb|CS732100.1| 


Sequence 96 from Patent WO2005083127 


1238 


0 


0 


emb|CS732095.1| 


Sequence 91 from Patent WO2005083127 


1238 


0 


0 


emb|CS732086.1| 


Sequence 82 from Patent WO2005083127 


1238 


0 


0 


emb|CS732111.1| 


Sequence 107 from Patent WO2005083127 


1236 


0 


0 


emb|CS732093.1| 


Sequence 89 from Patent WO2005083127 


1236 


0 


0 


emb|CS732092.1| 


Sequence 88 from Patent WO2005083127 


1234 


0 


0 


dbj | DI012300 . 1 | 


METHODS OF TREATMENT USING ErbB ANTIBODY-MAYT . . 


1227 


0 


0 


gb| AR928865. 1 | 


Sequence 7 from patent US 7097840 


1227 


0 


0 


gb|AR409602.1| 


Sequence 1 from patent US 6632979 


1227 


0 


0 


emb|AX060703.1| 


Sequence 1 from Patent WO0100244 


1227 


0 


0 


gb| 102857.11 Sequence 3 from Patent US 4446235 


1227 


0 


0 


gb|AR112701.1|AR112701 Sequence 9 from patent US 6130092 


1190 


0 


0 


emb|CS457474.1| 


Sequence 3 from Patent EP1731607 


1168 


0 


0 


emb|CQ803124.1| 


Sequence 10 from Patent WO2004035782 


1168 


0 


0 


emb|CQ803123.1| 


Sequence 9 from Patent WO2004035782 


1168 


0 


0 


emb|CQ803122.1| 


Sequence 8 from Patent WO2004035782 


1168 


0 


0 


emb|CQ803121.1| 


Sequence 7 from Patent WO2004035782 


1168 


0 


0 


emb|CQ803120.1| 


Sequence 6 from Patent WO2004035782 


1168 


0 


0 


emb|CQ803119.1| 


Sequence 5 from Patent WO2004035782 


1168 


0 


0 


gb|GC693420.1| 


Sequence 2793 from patent US 6812339 


1109 


0 


0 


gb|GC693419.1| 


Sequence 2792 from patent US 6812339 


1109 


0 


0 


gb|GC693418.1| 


Sequence 2791 from patent US 6812339 


1109 


0 


0 


gb|GC693417.1| 


Sequence 2790 from patent US 6812339 


1109 


0 


0 


gb|GC693416.1| 


Sequence 2789 from patent US 6812339 


1109 


0 


0 


dbj | DI126066 . 1 | 


AN EXPRESSION CASSETTE AND VECTOR FORTRANS IEN . . 


1098 


0 


0 


dbj | DD418157. 1 | 


AN EXPRESSION CASSETTE AND VECTOR FOR TRANS IE . . 


1098 


0 


0 


dbj | DJ418990 . 1 | 


Methods And Constructs For Expressing Polypep. . 


1068 


0 


0 


dbj IDI151081.il 


Methods And Constructs For Expressing Polypep.. 








dbj | DI128841 . 1 | 


AN EXPRESSION CASSETTE AND VECTOR FORTRANS IEN . . 


1068 


0 


0 


dbj | DD418139 . 1 | 


AN EXPRESSION CASSETTE AND VECTOR FOR TRANS IE . . 


1068 


0 


0 


emb|CS732108.1| 


Sequence 104 from Patent WO2005083127 


1033 


0 


0 


emb|CS732101.1| 


Sequence 97 from Patent WO2005083127 


1033 


0 


0 
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ALIGNMENTS 

>dbj |DI129697.1| AN EXPRESSION CASSETTE AND VECTOR FORTRANS IENT OR STABLE EXPRESSION 

OF EXOGENOUS MOLECULES 

Length=2660 

Score = 4817 bits (2608), Expect = 0.0 
Identities = 2660/2660 (100%), Gaps = 0/2660 (0%) 
Strand=Plus/Plus 



Query 1 

Sbjct 1 

Query 61 

Sbjct 61 

Query 121 

Sbjct 121 

Query 181 

Sbjct 181 

Query 241 

Sbjct 241 

Query 301 

Sbjct 301 

Query 361 

Sbjct 361 

Query 421 

Sbjct 421 

Query 481 

Sbjct 481 

Query 541 

Sbjct 541 

Query 601 

Sbjct 601 

Query 661 

Sbjct 661 

Query 721 

Sbjct 721 



GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 6 0 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 6 0 

TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 12 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 12 0 

GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 18 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 18 0 

TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 2 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 2 4 0 

TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 3 0 0 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 3 0 0 

CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 36 0 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 36 0 

GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 42 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 42 0 

CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 4 8 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 4 8 0 

AAGAGACC AGCTCAAGGATCCCAAGGCCCAACTCCCCGAACC AC TCAGGGTCCTGTGGAC 5 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAGAGACCAGC TCAAGGATCCCAAGGCCCAACTCCCCGAACC AC TCAGGGTCCTGTGGAC 5 4 0 

AGCTCACTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGCACAATGTGT 6 0 0 
I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGCTCACTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGCACAATGTGT 6 0 0 

CCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGGGG 66 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGGGG 66 0 

CTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTCCT 72 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTCCT 72 0 

GGTCCCTGGAGGAGGCagagagagagagagagaaaaaaaaaaCCCAGCTCCTGGAACAGG 7 8 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGTCCCTGGAGGAGG C AG AG AG AG AG AG AG AG AAAAAAAAAAC CCAGCTCCTG G AAC AG G 7 8 0 
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GAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGGCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGGCTC 

CCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGGGCAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGGGCAG 

TGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCGTCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCGTCG 



Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



CCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGGTGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGGTGC 

GCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGACTA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGACTA 

AGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGTGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGTGAG 

GTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGTCCTT 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGTCCTT 

CTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAACCCCCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
CTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAACCCCCA 

GACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCAGCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCAGCA 

GAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGAGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
GAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGAGCC 

CCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCT 

CCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCA 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCA 

ACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGG 

AAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGATCCAATCCTGGGGCCCCAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGATCCAATCCTGGGGCCCCAC 

TGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGA 
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Query 16 81 CCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTAC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 16 81 CCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTAC 1740 

Query 1741 AAC CTGGAGGGGAGGGAG G AAAAT GG AT G AAT GAG AG AG G G AG G G AAC AG T G C C C AAG C G 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1741 AACCTGGAGGGGAGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTGCCCAAGCG 1800 

Query 1801 CTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACT 186 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1801 CTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACT 186 0 

Query 1861 GGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCA 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1861 GGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCA 192 0 

Query 1921 CTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACA 19 8 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1921 CTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACA 19 8 0 

Query 19 81 TTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGG 2 0 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 19 81 TTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGG 2 0 40 

Query 2 0 41 TGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 0 41 TGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTG 2100 

Query 2101 CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTG 216 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2101 CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTG 216 0 

Query 2161 TATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACAAC 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2161 TATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACAAC 222 0 

Query 2221 CTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCAGTCTTGGCTC 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2221 CTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCAGTCTTGGCTC 22 8 0 

Query 2281 GCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCGAATAGTTG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2281 GCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCGAATAGTTG 2340 

Query 23 41 CGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGAGACGGGGT 2 40 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2341 CGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGAGACGGGGT 2400 

Query 2401 TTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCCCGCCTCGG 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2401 TTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCCCGCCTCGG 2460 

Query 2461 CCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCCTGTGATTT 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2461 CCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCCTGTGATTT 2520 

Query 2 521 T AAAAT AAT T AT ACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGGCCATGCCC 258 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2521 T AAAAT AAT T AT ACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGGCCATGCCC 2580 
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Query 2 5 81 AGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGGGTCCACTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j Ct 2 5 81 AGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGGGTCCACTC 

Query 26 41 AGTAGATGCTTGTTGAATTC 2660 

I I I I I I I I I I I I I I I I I I I I 
Sbjct 26 41 AGTAGATGCTTGTTGAATTC 2660 



>dbj |DI109112.1| FLP-mediated Recombination 
Length=2660 

Score = 4817 bits (2608), Expect = 0.0 
Identities = 2660/2660 (100%), Gaps = 0/2660 (0% 
Strand=Plus/Plus 



Query 1 

Sbjct 1 

Query 61 

Sbjct 61 

Query 121 

Sbjct 121 

Query 181 

Sbjct 181 

Query 241 

Sbjct 241 

Query 301 

Sbjct 301 

Query 361 

Sbjct 361 

Query 421 

Sbjct 421 

Query 481 

Sbjct 481 

Query 541 

Sbjct 541 

Query 601 

Sbjct 601 



GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 6 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 6 0 

TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 12 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 12 0 

GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 18 0 
I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 18 0 

TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 2 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 2 4 0 

TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 3 0 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 3 0 0 

CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 36 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 36 0 

GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 42 0 
I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 42 0 

CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 4 8 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 4 8 0 

AAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGGAC 5 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGGAC 5 4 0 

AGCTCACTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGCACAATGTGT 6 0 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGCTCACTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGCACAATGTGT 6 0 0 

CCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGGGG 66 0 
I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGGGG 66 0 
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CTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTCCT 72 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTCCT 72 0 

GGTCCCTGGAGGAGGCagagagagagagagagaaaaaaaaaaCCCAGCTCCTGGAACAGG 7 8 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGTCCCTGGAGGAGGCAGAGAGAGAGAGAGAGAAAAAAAAAACCCAGCTCCTGGAACAGG 7 8 0 

GAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGGCTC 8 40 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGGCTC 8 4 0 



Query 
Sbjct 



CCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGGGCAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGGGCAG 



Query 901 TGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCGTCG 96 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 901 TGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCGTCG 960 



Query 
Sbjct 



CCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGGTGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGGTGC 



GCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGACTA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGACTA 



Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



AGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGTGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGTGAG 

GTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGTCCTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGTCCTT 

C T C C TAGGAAGAAGCC TATATCCT G AAGGAGC AGAAG TATTCATTCC T GC AGAAC C C C C A 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C T C C TAGGAAGAAGCC TATATCCT GAAGGAGC AGAAG TATTCATTCC T GC AGAAC C C C C A 

GACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCAGCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCAGCA 

GAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGAGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGAGCC 

CCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCT 

CCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCA 

ACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGG 
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Query 1561 AAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGATCCAATCCTGGGGCCCCAC 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1561 AAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGATCCAATCCTGGGGCCCCAC 1620 

Query 1621 TGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGA 16 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1621 TGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGA 16 8 0 

Query 16 81 CCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTAC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 16 81 CCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTAC 1740 

Query 1741 AACCTGGAGGGGAGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTGCCCAAGCG 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1741 AACCTGGAGGGGAGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTGCCCAAGCG 1800 

Query 1801 CTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACT 186 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1801 CTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACT 186 0 

Query 1861 GGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCA 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1861 GGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCA 192 0 

Query 1921 CTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACA 19 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1921 CTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACA 19 8 0 

Query 19 81 TTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGG 2 0 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 19 81 TTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGG 2 0 40 

Query 2 0 41 TGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 0 41 TGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTG 2100 

Query 2101 CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTG 216 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2101 CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTG 216 0 

Query 2161 TATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACAAC 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2161 TATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACAAC 222 0 

Query 2221 CTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCAGTCTTGGCTC 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2221 CTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCAGTCTTGGCTC 22 8 0 

Query 2281 GCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCGAATAGTTG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2281 GCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCGAATAGTTG 2340 

Query 23 41 CGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGAGACGGGGT 2 40 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2341 CGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGAGACGGGGT 2400 

Query 2401 TTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCCCGCCTCGG 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2401 TTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCCCGCCTCGG 2460 
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Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



CCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCCTGTGATTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCCTGTGATTT 

TAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGGCCATGCCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGGCCATGCCC 

AGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGGGTCCACTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGGGTCCACTC 

AGTAGATGCTTGTTGAATTC 266 0 
I I I I I I I I I I I I I I I I I I I I 
AGTAGATGCTTGTTGAATTC 2660 



>dbj | DJ052243 . 1 | FLP-mediated Recombination 
Length=2660 

Score = 4817 bits (2608), Expect = 0.0 
Identities = 2660/2660 (100%), Gaps = 0/2660 (0%) 
Strand=Plus/Plus 



Query 1 

Sbjct 1 

Query 61 

Sbjct 61 

Query 121 

Sbjct 121 

Query 181 

Sbjct 181 

Query 241 

Sbjct 241 

Query 301 

Sbjct 301 

Query 361 

Sbjct 361 

Query 421 

Sbjct 421 

Query 481 

Sbjct 481 



GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 

TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 

GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 

TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 

TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 

CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 

GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 

CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 

AAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGGAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGGAC 
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AGCTCACTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGCACAATGTGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCTCACTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGCACAATGTGT 

CCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGGGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGGGG 

CTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTCCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTCCT 



Query 
Sbjct 



GGTCCCTGGAGGAGGCagagagagagagagagaaaaaaaaaaCCCAGCTCCTGGAACAGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGTCCCTGGAGGAG G C AG AG AG AG AG AG AG AG AAAAAAAAAAC CCAGCTCCTG G AAC AG G 



GAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGGCTC 8 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGGCTC 8 40 



Query 
Sbjct 



CCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGGGCAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGGGCAG 



Query 901 TGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCGTCG 96 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 901 TGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCGTCG 96 0 

Query 961 CCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGGTGC 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 961 CCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGGTGC 102 0 



Query 1021 GCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGACTA 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1021 GCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGACTA 1080 

Query 1081 AGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGTGAG 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1081 AGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGTGAG 1140 

Query 1141 GTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGTCCTT 12 0 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1141 GTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGTCCTT 12 0 0 

Query 12 01 C T C C T AGG AAG AAGC C TATATCCT G AAGGAGC AG AAG TATTCATTCC T GC AG AAC C C C C A 126 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 12 01 CTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAACCCCCA 126 0 

Query 1261 GACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCAGCA 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1261 GACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCAGCA 1320 

Query 1321 GAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGAGCC 13 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1321 GAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGAGCC 1380 

Query 1381 CCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1381 CCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCT 1440 
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Query 1441 CCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCA 150 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1441 CCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCA 150 0 

Query 1501 ACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGG 156 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1501 ACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGG 1560 

Query 1561 AAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGATCCAATCCTGGGGCCCCAC 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1561 AAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGATCCAATCCTGGGGCCCCAC 1620 

Query 1621 TGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGA 16 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1621 TGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGA 16 8 0 

Query 16 81 CCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTAC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 16 81 CCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTAC 1740 

Query 1741 AAC CTGGAGGGGAGGGAG G AAAAT GG AT G AAT GAG AG AG G G AG G G AAC AG T G C C C AAG C G 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1741 AACCTGGAGGGGAGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTGCCCAAGCG 1800 

Query 1801 CTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACT 186 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1801 CTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACT 186 0 

Query 1861 GGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCA 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1861 GGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCA 192 0 

Query 1921 CTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACA 19 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1921 CTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACA 19 8 0 

Query 19 81 TTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGG 2 0 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 19 81 TTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGG 2 0 40 

Query 2 0 41 TGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 0 41 TGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTG 2100 

Query 2101 CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTG 216 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2101 CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTG 216 0 

Query 2161 TATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACAAC 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2161 TATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACAAC 222 0 

Query 2221 CTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCAGTCTTGGCTC 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2221 CTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCAGTCTTGGCTC 22 8 0 

Query 2281 GCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCGAATAGTTG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2281 GCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCGAATAGTTG 2340 
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Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



2341 
2341 
2401 
2401 
2461 
2461 
2521 
2521 
2581 
2581 
2641 
2641 



CGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGAGACGGGGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGAGACGGGGT 

TTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCCCGCCTCGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCCCGCCTCGG 

CCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCCTGTGATTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCCTGTGATTT 

TAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGGCCATGCCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGGCCATGCCC 

AGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGGGTCCACTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGGGTCCACTC 

AGTAGATGCTTGTTGAATTC 266 0 
I I I I I I I I I I I I I I I I I I I I 
AGTAGATGCTTGTTGAATTC 266 0 



2400 
2400 
2460 
2460 
2520 
2520 
2580 
2580 
2640 
2640 



>dbj | DD418156 . 1 | AN EXPRESSION CASSETTE AND VECTOR FOR TRANSIENT OR STABLE EXPRESSIO 

OF EXOGENOUS MOLECULES 

Length=2660 

Score = 4817 bits (2608), Expect = 0.0 
Identities = 2660/2660 (100%), Gaps = 0/2660 (0%) 
Strand=Plus/Plus 

Query 1 GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1 GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 6 0 

Query 61 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 61 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 12 0 

Query 121 GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 121 GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 180 

Query 181 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 2 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 181 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 2 40 

Query 2 41 TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2 41 TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 300 

Query 301 CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 36 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 301 CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 36 0 

Query 361 GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 42 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 361 GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 420 

Query 421 CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 421 CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 480 

Query 481 AAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGGAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 481 AAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGGAC 540 

Query 541 AGCTCACTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGCACAATGTGT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 541 AGCTCACTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGCACAATGTGT 600 

Query 601 CCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGGGG 66 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 601 CCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGGGG 66 0 



Query 
Sbjct 



CTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTCCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTCCT 



Query 721 GGTCCCTGGAGGAGGCagagagagagagagagaaaaaaaaaaCCCAGCTCCTGGAACAGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 721 GGTCCCTGGAGGAGG C AG AG AG AG AG AG AG AG AAAAAAAAAAC C C AGC T C C T G G AAC AG G 



Query 
Sbjct 



GAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGGCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGGCTC 

CCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGGGCAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGGGCAG 



Query 9 01 TGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCGTCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 9 01 TGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCGTCG 

Query 961 CCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGGTGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j Ct 961 CCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGGTGC 

Query 1021 GCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGACTA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 1021 GCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGACTA 

Query 10 81 AGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGTGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j Ct 10 81 AGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGTGAG 

Query 1141 GTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGTCCTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j Ct 1141 GTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGTCCTT 

Query 12 01 CTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAACCCCCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j Ct 12 01 CTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAACCCCCA 

Query 12 61 GACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCAGCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 1261 GACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCAGCA 1320 

Query 1321 GAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGAGCC 13 8 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1321 GAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGAGCC 1380 

Query 1381 CCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCT 1440 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1381 CCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCT 1440 

Query 1441 CCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCA 150 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1441 CCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCA 150 0 

Query 1501 ACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGG 156 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1501 ACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGG 1560 

Query 1561 AAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGATCCAATCCTGGGGCCCCAC 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1561 AAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGATCCAATCCTGGGGCCCCAC 1620 

Query 1621 TGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGA 16 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1621 TGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGA 16 8 0 



Query 
Sbjct 



Query 
Sbjct 
Query 
Sbjct 



CCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTAC 

AACCTGGAGGGGAGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTGCCCAAGCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAC CTGGAGGGGAGGGAG G AAAAT GG AT G AAT G AG AG AGG G AG G G AAC AG T G C C C AAG C G 

CTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACT 

GGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCA 



Query 1921 CTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACA 19 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1921 CTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACA 19 8 0 

Query 19 81 TTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGG 2 0 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 19 81 TTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGG 2 0 40 

Query 2 0 41 TGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 0 41 TGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTG 2100 



Query 2101 CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTG 



Sbjct 
Query 



TATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 2161 TATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACAAC 222 0 

Query 2221 CTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCAGTCTTGGCTC 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2221 CTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCAGTCTTGGCTC 22 8 0 

Query 2281 GCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCGAATAGTTG 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2281 GCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCGAATAGTTG 2340 

Query 23 41 CGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGAGACGGGGT 2 40 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2341 CGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGAGACGGGGT 2400 

Query 2401 TTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCCCGCCTCGG 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2401 TTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCCCGCCTCGG 2460 

Query 2461 CCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCCTGTGATTT 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2461 CCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCCTGTGATTT 2520 

Query 2 521 TAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGGCCATGCCC 258 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2521 TAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGGCCATGCCC 2580 

Query 2581 AGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGGGTCCACTC 26 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2581 AGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGGGTCCACTC 26 40 

Query 26 41 AGTAGATGCTTGTTGAATTC 266 0 

I I I I I I I I I I I I I I I I I I I I 
Sbjct 2641 AGTAGATGCTTGTTGAATTC 2660 



>dbj | E00140 . 1 | Genomic DNA encoding human growth hormone 
Length=2660 

Score = 4795 bits (2596), Expect = 0.0 
Identities = 2656/2660 (99%), Gaps = 0/2660 (0%) 
Strand=Plus/Plus 

Query 1 GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j Ct 1 GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 

Query 6 1 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 61 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 

Query 121 GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 121 GAATAGGATAGAGAGTGGGATGGGGTCGCTAGGGGTCTCAAGGACTGGCCTATCCTGACA 

Query 181 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 181 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 

Query 2 41 TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



)://blast.ncbi.nlm.nih.gov/Blast.c 



3/2/09 



Page 16 of 49 



Sbjct 2 41 TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 300 

Query 301 CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 36 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 301 CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 36 0 



Query 
Sbjct 



GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 



Query 421 CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 421 CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 480 

Query 481 AAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGGAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 481 AAGAGACC AGCTCAAGGATCCCAAGGCCCAACTCCCCGAACC AC TCAGGGTCCTGTGGAC 540 

Query 541 AGCTCACTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGCACAATGTGT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 541 AGCTCACTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGCACAATGTGT 600 

Query 601 CCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGGGG 66 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 601 CCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGGGG 66 0 



Query 
Sbjct 



CTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTCCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTCCT 



GGTCCCTGGAGGAGGCagagagagagagagagaaaaaaaaaaCCCAGCTCCTGGAACAGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGTCCCTGGAG G AGGC AG AG AG AG AG AG AG AG AAAAAAAAAAC CCAGCTCCTG G AAC AG G 



Query 
Sbjct 



GAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGGCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGGCTC 



Query 
Sbjct 



CCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGGGCAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGGGCAG 



Query 901 TGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCGTCG 96 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 901 TGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCGTCG 96 0 



Query 961 CCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGGTGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j Ct 961 CCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGGTGC 

Query 1021 GCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGACTA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 1021 GCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGACTA 

Query 10 81 AGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGTGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j Ct 10 81 AGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGTGAG 

Query 1141 GTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGTCCTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 1141 GTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGTCCTT 12 0 0 

Query 12 01 CTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAACCCCCA 126 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 12 01 C T C C T AGG AAG AAGC C TAT AT C C TGAAGGAGC AGAAG TATTCATTCC T GC AG AAC C C C C A 126 0 

Query 1261 GACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCAGCA 132 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1261 GACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCAGCA 1320 

Query 1321 GAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGAGCC 13 8 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Sbjct 1321 GAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGACCC 1380 

Query 1381 CCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1381 CCCGGGCAGCACACCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCT 1440 

Query 1441 CCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCA 150 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1441 CCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCA 150 0 

Query 1501 ACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGG 156 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1501 ACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGG 1560 

Query 1561 AAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGATCCAATCCTGGGGCCCCAC 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1561 AAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGATCCAATCCTGGGGCCCCAC 1620 

Query 1621 TGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGA 16 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1621 TGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGA 16 8 0 

Query 16 81 CCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTAC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 16 81 CCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTAC 1740 

Query 1741 AAC CTGGAGGGGAGGGAG G AAAAT GG AT G AAT GAG AG AG G G AG G G AAC AG T G C C C AAG C G 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1741 AAC CTGGAGGGGAGGGAG G AAAAT GG AT G AAT GAG AG AG G G AG G G AAC AG T G C C C AAG C G 1800 

Query 1801 CTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACT 186 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1801 CTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACT 186 0 

Query 1861 GGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCA 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1861 GGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCA 192 0 

Query 1921 CTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACA 19 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1921 CTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACA 19 8 0 

Query 19 81 TTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGG 2 0 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 19 81 TTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGG 2 0 40 

Query 2 0 41 TGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTG 2100 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 2 0 41 TGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTG 2100 

Query 2101 CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTG 216 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2101 CCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTG 216 0 



Query 
Sbjct 



TATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACAAC 
I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACAAC 



Query 2 2 21 CTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCAGTCTTGGCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2221 CTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCAGTCTTGGCTC 

Query 2 2 81 GCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCGAATAGTTG 
I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 2 2 81 GCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCGAATAGTTG 



Query 
Sbjct 



CGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGAGACGGGGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I 
GGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGAGACGGGGT 



Query 2401 TTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCCCGCCTCGG 2460 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2401 TTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCCCGCCTCGG 2460 



Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



CCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCCTGTGATTT 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCCTGTGATTT 

TAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGGCCATGCCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGGCCATGCCC 

AGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGGGTCCACTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGGGTCCACTC 

AGTAGATGCTTGTTGAATTC 266 0 
I I I I I I I I I I I I I I I I I I I I 
AGTAGATGCTTGTTGAATTC 266 0 



>emb|AX719120.1| Sequence 1 from Patent EP1295938 
Length=5002 

Score = 4724 bits (2558), Expect = 0.0 
Identities = 2651/2668 (99%), Gaps = 13/2668 (0%) 
Strand=Plus/Plus 

Query 1 GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 1589 GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 

Query 6 1 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 16 49 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 

Query 121 GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 1709 GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGG-CTATCCTGACA 1767 

Query 181 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 2 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1768 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 1827 

Query 2 41 TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 300 

I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 182 8 TTAAAGAGAGGACAAGTTGGGTGGTATCTCT-GCTGACATTCTGTGCACAACCCTCACAA 18 86 

Query 301 CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 36 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1887 CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 1946 

Query 361 GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 42 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 19 47 GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 2 0 06 

Query 421 CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2007 CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 2 066 

Query 481 AAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGGAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 06 7 AAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGGAC 2126 

Query 541 AGCTCA-CTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTT-GGCACAATGT 59 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 212 7 AGCTCACCTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGGCACAATGT 2186 

Query 599 GTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGG 658 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2187 GTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGG 2246 

Query 659 GGCTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTC 718 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2247 GGCTTATGAATGTTAG-TATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTC 2305 

Query 719 CTGGTCCCTGGA-GGAGGCagagagagagagagagaaaaaaaaaaCCCAGCTCCTGGAAC 777 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2306 CTGGTCCCTGGAGGGAG G C AG AG AG AG AG AG AG AG AAAAAAAAAAC CCAGCTCCTG G AAC 2365 

Query 778 AGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGG 837 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2366 AGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGG 2425 

Query 838 CTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGGG 897 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2426 CTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGACTGTCCTGGCTTCAAGAGGG 2485 

Query 89 8 CAGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCG 957 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2486 CAGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCG 2545 

Query 958 TCGCCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGG 1017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2546 TCGCCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGG 2605 

Query 1018 TGCGCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGA 10 77 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 26 06 TGCGCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGA 2665 

Query 10 78 CTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGT 113 7 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2666 CTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGT 2725 

Query 113 8 GAGGTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGTC 119 7 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2726 GAGGTTCCCAGAAAAGTAACAATGGGAGCTGGTCTCCAGCATAGACCTTGGTGGGCGGTC 2785 

Query 119 8 CTTCTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAACCC 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2786 CTTCTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAACCC 2845 

Query 1258 CCAGACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCA 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2846 CCAGACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCA 2905 

Query 1318 GCAGAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGA 1377 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 29 06 GCAGAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGA 2965 

Query 1378 GCCCCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCA 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2966 GCCCCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCA 3 025 

Query 143 8 TCTCCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCG 149 7 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3 026 TCTCCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCG 3 0 85 

Query 149 8 CCAACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAG 1557 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3086 CCAACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAG 3145 

Query 155 8 AGGAAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGG-ATCC — AATCCTGGGG 1614 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3146 AGGAAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGGATCCCCAATCCTGGGG 3205 

Query 1615 CCCCACTGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGG 16 74 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 32 06 CCCCACTGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGG 3265 

Query 1675 CGCTGACCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTT 1734 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3266 CGCTGACCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTT 3325 

Query 1735 CTCTACAACCTGGAGGGGAGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTGCC 1794 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3326 CTCTACAACCTGGAGGGGAGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTGCC 3385 

Query 1795 CAAGCGCTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCC 1854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3386 CAAGCGCTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCC 3445 

Query 1855 CGGACTGGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGAT 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3446 CGGACTGGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGAT 3505 

Query 1915 GACGCACTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTC 19 74 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



)://blast.ncbi.nlm.nih.gov/Blast.c 



3/2/09 



Page 21 of 49 



Sbjct 3506 GACGCACTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTC 3565 

Query 1975 GAGACATTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTG 2034 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 3566 GAGACATTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTG 3625 

Query 2035 CCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACT 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 3626 CCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACT 36 85 

Query 2 095 CCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTG 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 3686 CCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTG 3745 

Query 2155 TCCTTGTATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAA 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 3746 TCCTTGTATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGC-AGGTTGGGAA 3804 

Query 2215 GACAACCTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCA-G-T 2 2 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 3805 GACAACCTGTAGGGCCTTCAGGGTCTATT-GGGAACCAGGCTGGAGTGCAGTGGCACGAT 3863 

Query 2273 CTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCG 2332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 3864 CTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCG 3923 

Query 2333 AATAGTTGCGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGA 2392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 3924 AATAGTTGGGATTCCAGGCATGCACGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGA 3983 

Query 2393 GACGGGGTTTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCC 2 452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 3984 GACGGGGTTTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCC 4 0 43 

Query 2 453 CGCCTCGGCCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCC 2512 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 4044 CGCCTCGGCCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCC 4103 

Query 2 513 TGTGATTTTAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGG 2 5 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 4104 TGTGATTTTAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGG 4163 

Query 2573 CCATGCCCAGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGG 2632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 4164 CCATGCCCAGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGG 4223 

Query 2633 GTCCACTCAGTAGATGCTTGTTGAATTC 2660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 4224 GTCCACTCAGTAGATGCTTGTTGAATTC 4251 



Score = 204 bits (110), Expect = 4e-49 
Identities = 213/261 (81%), Gaps = 14/261 (5%) 
Strand=Plus/Plus 

Query 2250 CCAGGCTGGAGTGCAGT-G-GCAGTCTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAA 2307 

I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 
Sbjct 646 CCAGGCTGGAGTGCAGTGGCGCAATCTTGGCTCACAGCAACCTCTGCCTCCTGGGTTCAA 705 

Query 23 0 8 GCGATTCTCCTGCCTCAGTCTCCCGAA-TAGTTGCGATTCCAGGCA — TGCAAGACCAGG 236 4 
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I I I I I I I I I I I I I I I I I I I I I I I II III II I I I I I III III I III I 

Sbjct 706 GCGATTCTCCTGCCTCAGCCTCCC-AAGTAGCTGGGATTACGGGCTCGTGCCA — CCATG 762 

Query 2365 -CTCAGCTAATTTTTGTATTTTT-GGTAGAGACGGGGTTTCACCATATTGGCCAGTCTGG 2422 

I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I II II I I I I 
Sbjct 763 AC-CAGCTAATTTTTGTATTTTTAGG-AGAGATGGAGTTTTGCCATGTGGGTTAGCCTGG 820 

Query 2423 TCTC-CATCTCCTGACCTCAGGTAATCCGCCCGCCTCGGCCTCCCAAATTGCTGGGATTA 2481 

III II I I I I I I I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 821 TCTTGCA-CTCCTGACCTTAAGTGATCCACCCACCTCAGCCTCCCAAAGTGCTGGGATTA 879 

Query 2 482 CAGGTATGAGCCACTGGGCCC 2502 

III I I I I I I I I I I I I I I 
Sbjct 880 TAGGCATGAGCCACCGTGCCC 900 



>emb | AX659146 . 1 | Sequence 1 from Patent WO02101002 
Length=5002 

Score = 4724 bits (2558), Expect = 0.0 
Identities = 2651/2668 (99%), Gaps = 13/2668 (0%) 
Strand=Plus/Plus 



Query 
Sbjct 



GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 



Query 61 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1649 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 1708 

Query 121 GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1709 GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGG-CTATCCTGACA 1767 

Query 181 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 2 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1768 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 1827 

Query 2 41 TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 182 8 TTAAAGAGAGGACAAGTTGGGTGGTATCTCT-GCTGACATTCTGTGCACAACCCTCACAA 18 86 

Query 301 CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 36 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 1887 CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 1946 

Query 361 GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 19 47 GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 2 0 06 

Query 421 CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2007 CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 2 066 

Query 481 AAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGGAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 06 7 AAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGGAC 2126 

Query 541 AGCTCA-CTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTT-GGCACAATGT 59 8 
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Query 
Sbjct 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCTCACCTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGGCACAATGT 2186 

GTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGG 65 8 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGG 2 2 46 



Query 659 GGCTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTC 718 

I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2247 GGCTTATGAATGTTAG-TATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTC 2305 



Query 
Sbjct 



CTGGTCCCTGGA-GGAGGCagagagagagagagagaaaaaaaaaaCCCAGCTCCTGGAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGTCCCTGGAGG G AG GC AG AG AG AG AG AG AG AG AAAAAAAAAAC CCAGCTCCTG G AAC 

AGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGG 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCTCCGGTTTCTCCCCAGG 

CTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGACTGTCCTGGCTTCAAGAGGG 



Query 
Sbjct 



CAGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCCG 



Query 958 TCGCCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGG 1017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2546 TCGCCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGGG 2605 



Query 1018 TGCGCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGA 10 77 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 26 06 TGCGCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAGA 2665 

Query 10 78 CTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGT 113 7 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2666 CTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAGT 2725 

Query 113 8 GAGGTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGTC 119 7 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2726 GAGGTTCCCAGAAAAGTAACAATGGGAGCTGGTCTCCAGCATAGACCTTGGTGGGCGGTC 2785 

Query 119 8 CTTCTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAACCC 1257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2786 CTTCTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAACCC 2845 

Query 1258 CCAGACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCA 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2846 CCAGACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGCA 2905 

Query 1318 GCAGAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGA 13 7 7 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 29 06 GCAGAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGATGGGGTAGACCTGTGGTCAGA 2965 

Query 1378 GCCCCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCA 1437 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2966 GCCCCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCA 3 025 

Query 143 8 TCTCCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCG 149 7 



)://blast.ncbi.nlm.nih.gov/Blast.c 



3/2/09 



Page 24 of 49 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3 026 TCTCCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCG 3 0 85 

Query 149 8 CCAACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAG 155 7 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3086 CCAACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAG 3145 

Query 155 8 AGGAAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGG-ATCC — AATCCTGGGG 1614 

I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3146 AGGAAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGGATCCCCAATCCTGGGG 3205 



Query 
Sbjct 



CCCCACTGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCCACTGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGG 

CGCTGACCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGCTGACCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTT 



Query 1735 CTCTACAACCTGGAGGGGAGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 3326 CTCTACAACCTGGAGGGGAGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTGCC 



Query 
Sbjct 



CAAGCGCTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAAGCGCTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCC 



Query 1855 CGGACTGGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGAT 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 3446 CGGACTGGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGAT 3505 



Query 1915 GACGCACTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTC 19 74 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3506 GACGCACTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTC 3565 

Query 1975 GAGACATTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTG 2034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3566 GAGACATTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTG 3625 

Query 2035 CCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACT 2094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3626 CCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACT 36 85 

Query 2 095 CCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTG 2154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3686 CCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTG 3745 

Query 2155 TCCTTGTATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAA 2214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3746 TCCTTGTATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGC-AGGTTGGGAA 3804 

Query 2215 GACAACCTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCA-G-T 2 2 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3805 GACAACCTGTAGGGCCTTCAGGGTCTATT-GGGAACCAGGCTGGAGTGCAGTGGCACGAT 3863 

Query 2273 CTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCG 2332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3864 CTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCCCG 3923 

Query 2333 AATAGTTGCGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGA 2392 
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Sbjct 3924 AATAGTTGGGATTCCAGGCATGCACGACCAGGCTCAGCTAATTTTTGTATTTTTGGTAGA 3983 



Query 
Sbjct 



GACGGGGTTTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACGGGGTTTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCGCC 



Query 2453 CGCCTCGGCCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCC 2512 

I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 4044 CGCCTCGGCCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGTCC 4103 



Query 
Sbjct 



TGTGATTTTAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGTGATTTTAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCTGG 

CCATGCCCAGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCATGCCCAGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATTGG 



Query 2633 GTCCACTCAGTAGATGCTTGTTGAATTC 2660 

I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Sbjct 4224 GTCCACTCAGTAGATGCTTGTTGAATTC 4251 



Score = 204 bits (110), Expect = 4e-49 
Identities = 213/261 (81%), Gaps = 14/261 (5%) 
Strand=Plus/Plus 



Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



CCAGGCTGGAGTGCAGT-G-GCAGTCTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAA 
I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 
CCAGGCTGGAGTGCAGTGGCGCAATCTTGGCTCACAGCAACCTCTGCCTCCTGGGTTCAA 

GCGATTCTCCTGCCTCAGTCTCCCGAA-TAGTTGCGATTCCAGGCA — TGCAAGACCAGG 
I I I I I I I I I I I I I I I I I I I I I I I II III II I I I I I III III I III I 
GCGATTCTCCTGCCTCAGCCTCCC-AAGTAGCTGGGATTACGGGCTCGTGCCA — CCATG 

-CTCAGCTAATTTTTGTATTTTT-GGTAGAGACGGGGTTTCACCATATTGGCCAGTCTGG 
I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I II II I I I I 
AC-CAGCTAATTTTTGTATTTTTAGG-AGAGATGGAGTTTTGCCATGTGGGTTAGCCTGG 

TCTC-CATCTCCTGACCTCAGGTAATCCGCCCGCCTCGGCCTCCCAAATTGCTGGGATTA 
III II I I I I I I I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I 
TCTTGCA-CTCCTGACCTTAAGTGATCCACCCACCTCAGCCTCCCAAAGTGCTGGGATTA 

CAGGTATGAGCCACTGGGCCC 2502 

III I I I I I I I I I I I I I I 
TAGGCATGAGCCACCGTGCCC 900 



>emb|CS741886.1| 
Length=20631 



Sequence 9882 from Patent WO2005083127 



Score = 4684 bits (2536), Expect = 0.0 
Identities = 2625/2670 (98%), Gaps = 16/2670 (0%) 
Strand=Plus /Minus 



Query 1 GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sb j Ct 9106 GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 
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Query 61 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 9046 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 8987 

Query 121 GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 180 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 89 86 GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGG-CTATCCTGACA 892 8 

Query 181 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 2 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 892 7 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 8 86 8 

Query 2 41 TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8 86 7 TTAAAGAGAGGACAAGTTGGGTGGTATCTCT-GCTGACATTCTGTGCACAACCCTCACAA 8 8 09 

Query 301 CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 36 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8808 CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 8749 

Query 361 GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8 748 GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 86 89 

Query 421 CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 86 8 8 CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 8629 

Query 481 AAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGGAC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8628 AAGAGACCAGCTCAAGGATCCCAAGGCCCRACTCCCCGAACCACTCAGGGTCCTGTGGAC 8569 

Query 541 AGCTCA-CTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTT-GGCACAATGT 598 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8568 AGCTCACCTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGGCACAATGT 8509 

Query 599 GTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGG 658 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8508 GTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGG 8449 

Query 659 GGCTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTC 718 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8448 GGCTTATGAATGTTAG-TATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTC 8390 

Query 719 CTGGTCCCTGGA-GGAGGCagagagagagagagagaaaaaaaaaaCCCAGCTCCTGGAAC 777 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8389 CTGGTCCCTGGAGGGAGGC - AG AG AG AG AG AG AG ARAAAAAAAAAC CCAGCTCCTG G AAC 8331 

Query 778 AGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTG-CCTCCGGTTTCTCCCCAG 836 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8330 AGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCCTCCGGTTTCTCCCCAG 8271 

Query 837 GCTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGG 896 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8270 GCTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGG 8211 

Query 897 GCAGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCC 956 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8210 GCAGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCC 8151 
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Query 957 GTCGCCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGG 1016 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8150 GTCGCCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTRTAAGCTCTTGGGTAATGG 8 091 

Query 1017 GTGCGCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAG 10 76 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8090 GTGCGCTTCAGAGGTGGCAGGAAGGGGTGAMTTTCCCCCGCTGGGAAGTAATGGGAGGAG 8031 

Query 10 77 ACTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAG 1136 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 8030 ACTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAG 7971 

Query 113 7 TGAGGTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGT 1196 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7970 TGAGGTTCCCAGAAAAGTAACAATGGGAGCWGGTCTCCAGCATAGACCTTGGTGGGCGGT 7911 

Query 119 7 CCTTCTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAACC 12 56 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7910 CCTTCTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAACC 7851 

Query 1257 CCCAGACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGC 1316 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7850 CCCAGACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACWGGGTGAAAACGC 7791 

Query 1317 AGCAGAAATCTGTGAGTGGATGCCTTCTCCCCAGGT-GGGATGGGGTAGACCTGTGGTCA 13 75 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7790 AGCAGAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGGATGGGGTAGACCTGTGGTCA 7731 

Query 1376 GAGCCCCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCG 1435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7730 GAGCCCCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCG 7671 

Query 1436 CATCTCCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTT 1495 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7670 CATCTCCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTT 7611 

Query 1496 CGCCAACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCT 1555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7610 CGCCAACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCT 7551 

Query 1556 AGAGGAAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCA-GGAT — CCAATCCTGG 1612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7550 AGAGGAAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGGATCCCCAATCCTGG 7491 

Query 1613 GGCCCCACTGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCA 16 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7490 GGCCCCACTGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCA 7431 

Query 16 73 GGCGCTGACCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCT 1732 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7 43 0 GGCGCTGACCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCT 73 71 

Query 1733 TTCTCTACAACCTGGAGGGGAGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTG 1792 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 73 7 0 TTCTCTACAACCTGRAGGGGRGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTG 7311 

Query 1793 CCCAAGCGCTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCC 1852 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7310 CCCAAGCGCTTGGCCTCTCCTTCTCTTSCTTCACTTTGCAGAGGCTGGAAGATGGCAGCC 7251 
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Query 1853 CCCGGACTGGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACG 1912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7250 CCCGGACTGGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACG 7191 

Query 1913 ATGACGCACTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGG 19 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7190 ATGACGCACTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGG 7131 

Query 1973 TCGAGACATTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGC 2032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7130 TCGAGACATTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGC 7071 

Query 2033 TGCCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTA 2092 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7070 TGCCCGGGTGGCATCCCTGTGACCCCTCCCCASTGCCTCTCCTGGTSGTGGAAGGTGCTA 7011 

Query 2093 CTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGG 2152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7010 CTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGG 6951 

Query 2153 TGTCCTTGTATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGG 2212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 6950 TGTCCTTGTATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGG-CAGGTTGGG 6 892 

Query 2213 AAGACAACCTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCA-G 22 71 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 6891 AAGACAACCTGTAGGGCCTTCAGGGTCTATT-GGGAACCAGGCTGGAGTGCAGTGGCACG 6833 

Query 2272 -TCTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCC 2330 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 6832 ATCTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCC 6773 

Query 2331 CGAATAGTTGCGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTA 239 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 6772 CGAATAGTTGGGATTCCAGGCATGCACGACCAGGCTCAGCTAATTTTTGTATTTTTGGTA 6713 

Query 2391 GAGACGGGGTTTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCG 2 45 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 6 712 GAGACGGGGTTTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCG 6653 

Query 2451 CCCGCCTCGGCCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGT 2510 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 6652 CCCGCCTCGGCCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGT 6593 

Query 2511 CCTGTGATTTTAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCT 2570 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 6592 CCTGTGATTTTAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCT 6533 

Query 2571 GGCCATGCCCAGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATT 2630 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 6532 GRCCATGCCCAGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATT 6 4 73 

Query 2631 GGGTCCACTCAGTAGATGCTTGTTGAATTC 2660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 6472 GGGTCCACTCAGTAGATGCTTGTTGAATTC 6443 



Score = 1037 bits (561), Expect = 0.0 
Identities = 680/737 (92%), Gaps = 9/737 (1%) 
Strand=Plus /Minus 
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GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 
I I I I I I I I III III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAATTCAGGACTCAATGGTGCTCAGAACCCCCACAATCTATTGGCTGTGC-TTGGCCCCT 

TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTCCCAACACACACATTCTGTCTGGTGGGTGGAAGTTAAACACGCGGGGAGGAGGAAAG 



Query 121 GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 833 GAATAGGATAGAGAGTGGAATGGGGTCGGTAGGGGTCTCAAGGACTGG-CTATCCTGACA 



180 
775 



Query 
Sbjct 



TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 
I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCTTCCCCGCGTTCAGGTTGACCAACATGGCCTGCAGCCAGAGGGCACCCACCTGACCC 



Query 2 41 TTAAAGAGAGGACAAGTTGGGTGGTA-TCTCTGGCTGACATTCTGTGCACAACCCTCACA 299 

I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I III III 
Sbjct 714 TTAAAGAGAGGACAAGTTGGGTGG-AGTCTGTGGCTGACACTCTGTGCACAATCCTTACA 656 



Query 
Sbjct 



ACGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGT 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACACTGGTGATGGTGAGAAGGGAAAGACGACAAGCCAGGGGGCATGATCCCAGCATGTGT 



GGGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
GGGAGGAGCTTCCAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCATGCATAAATGT 

GCAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGG-TATAAAAAGGGCCC 
II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACACAGAAACAGGTGGGGTCAAGCAGGGAGAGAGAACTGGCCAGGGTATAAAAAGGGCCC 



Query 
Sbjct 



ACAAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACAAGAGACCGGCTCTAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGG 



Query 539 ACAGCTCAC-TAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGG-CACAAT 596 

I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 415 ACAGCTCACCTAGTGGCAATGGCTCCAGGTAAGCGCCCCTAAAATCCCTTTGGGCACAAC 356 



Query 
Sbjct 



GTGTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTT 
I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGTCCTGAGGGGAGAGGCAGCGCCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTT 



GGGGCTTATGAATGTTAGCTATCGCCATCTAAGCCCAG-TATTTGGCCAATCTCTGAATG 
I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGGCTTATGAATGTGAG-TATCGCCATCTAAGGCCAGATATTTGGCCAATCTCTGAATG 



TTCCTGGTCCCTGGAGG 732 
I I I I I I I I I I I I I I I I 
TTCCTGGTCTCTGGAGG 220 



Score = 255 bits (138), Expect = le-64 
Identities = 172/188 (91%), Gaps = 3/188 (1%) 
Strand=Plus /Minus 

Query 765 CAGCTCCTGGAACAGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTG-CCTCC 823 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 
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Sbjct 194 CAGCTCCTGGAGCAGGGAGAGCGCTGGCCTCTTCCTCTCCGGCTCCCTCCATTGCCCTCC 135 

Query 824 GGTTTCTCCCCAGGCTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCC 883 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Sbjct 13 4 GGTTTCTCCCCAGGCTCCCGGACGTCCCTGCTCCTGGCTTTTGCCCTGCTCTGCCTGCCC 75 

Query 884 TGGCTTCAAGAGGGCAG-TGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGC 9 42 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7 4 TGGCTTCAAGAGG-CTGGTGCCGTCCAAACCGTTCCGTTATCCAGGCTTTTTGACCACGC 16 

Query 943 TATGCTCC 950 

I I I I I I I I 
Sbjct 15 TATGCTCC 8 



Score = 209 bits (113), Expect = 8e-51 
Identities = 213/260 (81%), Gaps = 12/260 (4%) 
Strand=Plus /Minus 



Query 2250 CCAGGCTGGAGTGCAGT-G-GCAGTCTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAA 2307 

I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 

Sbjct 10049 CCAGGCTGGAGTGCAGTGGCGCAATCTTGGCTCACAGCAACCTCTGCCTCCTGGGTTCAA 9990 

Query 2308 GCGATTCTCCTGCCTCAGTCTCCCGAA-TAGTTGCGATTCCAGGCA — TGCAAGACCAGG 2364 

I I I I I I I I I I I I I I I I I I Mill II III II I I I I I III III I III I 

Sbjct 9989 GCGATTCTCCTGCCTCAGCCTCCC-AAGTAGCTGGGATTACGGGCTCGTGCCA — CCATG 9933 

Query 2365 CTCAGCTAATTTTTGTATTTTT-GGTAGAGACGGGGTTTCACCATATTGGCCAGTCTGGT 2423 

I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I II II I I I I I 
Sbjct 9932 CCCAGCTAATTTTTGTATTTTTAGG-AGAGATGGAGTTTTGCCATGTGGGTTAGCCTGGT 9874 

Query 2 42 4 CTC-CATCTCCTGACCTCAGGTAATCCGCCCGCCTCGGCCTCCCAAATTGCTGGGATTAC 2 482 

II II I I I I I I I I I I I II I I I I III I I II I I I I I I I I I I I I I I I I I I I I I 

Sbjct 9873 CTTGCA-CTCCTGACCTTAAGTGATCCACCCACCTCAGCCTCCCAAAGTGCTGGGATTAT 9815 



AGGTATGAGCCACTGGGCCC 2502 
III I I I I I I I I I I I I I I 
AGGCATGAGCCACCGTGCCC 9795 



>emb|CS741885.1| Sequence 9881 from Patent WO2005083127 
Length=58905 

Score = 4684 bits (2536), Expect = 0.0 
Identities = 2625/2670 (98%), Gaps = 16/2670 (0%) 
Strand=Plus/Plus 



Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 



GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 6 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 42 65 

TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 12 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 42 71 

GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 18 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGG-CTATCCTGACA 42 7 7 

TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 2 4 0 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

42 7 72 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 42 831 



Query 
Sbjct 



Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 3 0 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTAAAGAGAGGACAAGTTGGGTGGTATCTCT-GCTGACATTCTGTGCACAACCCTCACAA 42 89 0 

CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 36 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 42 95 0 

GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 42 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 43010 

CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 4 8 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGGTATAAAAAGGGCCCAC 43070 

AAGAGACC AGCTCAAGGATCCCAAGGCCCAACTCCCCGAACC AC TCAGGGTCCTGTGGAC 5 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAGAGACCAGCTCAAGGATCCCAAGGCCCRACTCCCCGAACCACTCAGGGTCCTGTGGAC 4313 0 

AGCTCA-CTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTT-GGCACAATGT 59 8 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGCTCACCTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGGCACAATGT 4319 0 



Query 599 GTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGG 658 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 43191 GTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTTGG 43250 

Query 659 GGCTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTC 718 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 43251 GGCTTATGAATGTTAG-TATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGTTC 43309 

Query 719 CTGGTCCCTGGA-GGAGGCagagagagagagagagaaaaaaaaaaCCCAGCTCCTGGAAC 777 

Sbjct 43310 CTGGTCCCTGGAGGGAGGC - AG AG AG AG AG AG AG AR AAAAAAAAAC CCAGCTCCTG G AAC 43368 

Query 778 AGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTG-CCTCCGGTTTCTCCCCAG 836 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 43369 AGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTGCCCTCCGGTTTCTCCCCAG 43428 

Query 837 GCTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGG 896 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 43429 GCTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCCTGGCTTCAAGAGG 43488 

Query 897 GCAGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCC 956 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 43 489 GCAGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCTATGCTCCGCGCCC 43548 

Query 957 GTCGCCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGCTCTTGGGTAATGG 1016 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 43549 GTCGCCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTRTAAGCTCTTGGGTAATGG 43608 

Query 1017 GTGCGCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAAGTAATGGGAGGAG 10 76 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 436 09 GTGCGCTTCAGAGGTGGCAGGAAGGGGTGAMTTTCCCCCGCTGGGAAGTAATGGGAGGAG 4366 8 

Query 10 77 ACTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAG 1136 
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Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

43669 ACTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGATGAGCATACGCTGAG 43 72 8 

113 7 TGAGGTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGACCTTGGTGGGCGGT 1196 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

43 72 9 TGAGGTTCCCAGAAAAGTAACAATGGGAGCWGGTCTCCAGCATAGACCTTGGTGGGCGGT 43 78 8 

119 7 CCTTCTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTCATTCCTGCAGAA.ee 12 56 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

43789 CCTTCTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGT AT TCATTCCTGCAGAACC 43848 

12 5 7 CCCAGACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACAGGGTGAAAACGC 1316 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

43 8 49 CCCAGACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAACWGGGTGAAAACGC 43908 

1317 AGCAGAAATCTGTGAGTGGATGCCTTCTCCCCAGGT-GGGATGGGGTAGACCTGTGGTCA 13 75 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

43909 AGCAGAAATCTGTGAGTGGATGCCTTCTCCCCAGGTGGGGATGGGGTAGACCTGTGGTCA 43968 

13 76 GAGCCCCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCG 1435 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

43969 GAGCCCCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCG 44028 

1436 CATCTCCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTT 1495 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

4 4 02 9 CATCTCCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTT 4 4 0 8 8 

1496 CGCCAACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCT 1555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 4 0 89 CGCCAACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCGCCACCTGAAGGACCT 4 414 8 

1556 AGAGGAAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCA-GGAT — CCAATCCTGG 1612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

4 4149 AGAGGAAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCAGGGATCCCCAATCCTGG 4 42 0 8 

1613 GGCCCCACTGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCA 16 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 42 09 GGCCCCACTGGCTTCCAGGGACTGGGGAGAGAAACACTGCTGCCCTCTTTTTAGCAGTCA 4 42 6 8 

16 73 GGCGCTGACCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCT 1732 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

4 42 69 GGCGCTGACCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCT 4 4328 

1733 TTCTCTACAACCTGGAGGGGAGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTG 1792 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 4329 TTCTCTACAACCTGRAGGGGRGGGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTG 44388 

1793 CCCAAGCGCTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCC 1852 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 4389 CCCAAGCGCTTGGCCTCTCCTTCTCTTSCTTCACTTTGCAGAGGCTGGAAGATGGCAGCC 44448 

1853 CCCGGACTGGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACG 1912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 4 4 49 CCCGGACTGGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACG 4 45 0 8 

1913 ATGACGCACTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGG 19 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

4 4509 ATGACGCACTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGG 44568 

19 73 TCGAGACATTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGC 2 032 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 44569 TCGAGACATTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGC 44628 

Query 2033 TGCCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTA 2092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 44629 TGCCCGGGTGGCATCCCTGTGACCCCTCCCCASTGCCTCTCCTGGTSGTGGAAGGTGCTA 44688 

Query 2093 CTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGG 2152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 44689 CTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGG 44748 

Query 2153 TGTCCTTGTATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGG 2212 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 44749 TGTCCTTGTATAATATTATGGGGTGGAGGCGGGTGGTATGGAGCAAGGGGC-AGGTTGGG 44807 

Query 2 213 AAGACAACCTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCTGGAGTGCAGTGGCA-G 22 71 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 448 0 8 AAGACAACCTGTAGGGCCTTCAGGGTCTATT-GGGAACCAGGCTGGAGTGCAGTGGCACG 44866 

Query 2272 -TCTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCC 2330 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 44867 ATCTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGTCTCC 44926 

Query 2331 CGAATAGTTGCGATTCCAGGCATGCAAGACCAGGCTCAGCTAATTTTTGTATTTTTGGTA 239 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 44927 CGAATAGTTGGGATTCCAGGCATGCACGACCAGGCTCAGCTAATTTTTGTATTTTTGGTA 44986 

Query 2391 GAGACGGGGTTTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCG 2 450 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 44987 GAGACGGGGTTTCACCATATTGGCCAGTCTGGTCTCCATCTCCTGACCTCAGGTAATCCG 45046 

Query 2 451 CCCGCCTCGGCCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGT 2510 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 45047 CCCGCCTCGGCCTCCCAAATTGCTGGGATTACAGGTATGAGCCACTGGGCCCTTCCCTGT 45106 

Query 2511 CCTGTGATTTTAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCT 2570 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 45107 CCTGTGATTTTAAAATAATTATACCAGCAGAAGGACGTCCAGACACAGCATGGGCTACCT 45166 

Query 2571 GGCCATGCCCAGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATT 2630 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 45167 GRCCATGCCCAGCCAGTTGGACATTTGAGTTGTTTGCTTGGCACTGTCCTCTCATGCATT 45226 

Query 2 631 GGGTCCACTCAGTAGATGCTTGTTGAATTC 266 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 45227 GGGTCCACTCAGTAGATGCTTGTTGAATTC 45256 

Score = 2760 bits (1494), Expect = 0.0 
Identities = 1766/1908 (92%), Gaps = 19/1908 (0%) 
Strand=Plus/Plus 

Query 765 CAGCTCCTGGAACAGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTG-CCTCC 823 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 6 412 CAGCTCCTGGAGCAGGGAGAGYGCTGGCCTCTTGCTCTCCGGCTCCCTCTGTTGCCCTCT 6 471 

Query 824 GGTTTCTCCCCAGGCTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCC 883 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Sbjct 6472 GGTTTCTCCCCAGGCTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGCCC 6531 



)://blast.ncbi.nlm.nih.gov/Blast.c 



3/2/09 



Page 34 of 49 



Query 884 TGGCTTCAAGAGGGCAGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCT 9 43 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 6532 TGGCTTCAAGAGGGCAGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCT 6591 

Query 9 44 ATGCTCCGCGCCCGTCGCCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGC 10 03 

I I I I I I I I I I I I III III I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 

Sbjct 6592 ATGCTCYGCGCCCATCGTCTGCACCAGCTGGCMTWTGACAYCTACCAGGAGTTTGTAAGC 6651 

Query 1004 TCTTGGGTAATGGGTGCGCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAA 1063 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 6652 TCTTGGGGAATGGGTGCGCATCAGGGGTGGCAGGAAGGGGTGACTTTCCCCCGCTGGGAA 6711 

Query 106 4 GTAATG-GGAGGAGACTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGAT 1122 

III I I I I I I I I I I I I I I I I II I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 

Sbjct 6712 ATAA-GAGGAGGAGACTAAGGAGCTCAGGGTT-TTTCCYGAAGCGAAAATGCAGGCAGAT 6769 

Query 1123 GAGCATACGCTGAGTGAGGTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGA 1182 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 6 770 GAGCACACGCTGAGTGAGGTTCCCAGAAAAGTAACAATGGGAGCTGGTCTCCAGCGTAGA 6 829 

Query 1183 CCTTGGTGGGCGGTCCTTCTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTC 1242 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 6830 CCTTGGTGGGCGGTCCTTCTCCTAGGAAGAAGCCTATATCCCAAAGGAACAGAAGTATTC 6889 

Query 1243 ATTCCTGCAGAACCCCCAGACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAA 1302 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 6890 ATTCCTGCAGRACCCCCAGACCTCCCTCTGTTTCTCAGAGTCTATTCCGACACCCTCCAA 6949 

Query 13 03 CAGGGTGAAAACGCAGCAGAAAT-CTGTGAGTGGATGCCTTCTCCCCAGG-TGGGATGGG 136 0 

I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 6950 CAGGGAGGAAACACAACAGAAATYC-GTGAGTGGATGCCTTCTCCCCAGGCGGGGATGGG 70 0 8 

Query 1361 GTAGACCTGTGGTCAGAGCCCCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAA 142 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 70 09 GGAGACCTGTAGTCAGAGCCCCCGGGCAGCACAGCCAATGCCCGTCCTTCCCCTGCAGAA 706 8 

Query 1421 CCTAGAGCTGCTCCGCATCTCCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCT 1480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7069 CCTARAGCTGCTCYGCATCTSCCTGCTGCTCATCCAGTCGTGGCTGGAGCCCGTGCAGTT 712 8 

Query 1481 CCTCAGGAGCGTCTTCGCCAACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCG 1540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I 

Sbjct 7129 CCTCAGGAGTGTCTTCGCCAACAGCCTGGTGTACGGCGCCTCTGACWGCAACDTCTAT-G 718 7 

Query 1541 -CCACCTGAAGGACCTAGAGGAAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCA- 159 8 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Sbjct 7188 RCCTCCTAAAGGACCTAGAGGAAGGCATCCAAACRCTGATGGGGGTGAGGGTGGCGCCAG 7247 

Query 1599 GGAT — CCAATCCTGGGGCCCCACTGGCTTCCAGGGACTG-GGGAGAGAAACACTGCTGC 1655 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7248 GGKTCCCCAATCCTGGAGCCCCACTGACTTTGAGAG-CTGTRTTAGAGAAACACTGCTGC 7306 

Query 1656 CCTCTTTTTAGCAGTCAGGCGCTGACCCAAGAGAACTCACCGTATTCTTCATTTCCCCTC 1715 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 73 0 7 CCTCTTTTTAGCAGWCAGGCCCTGACCCAAGAGAACTCACCTTATTCTTCATTTCCCCTC 7366 

Query 1716 GTGAATCCTCCAGGCCTTTCTCTACAACCTGGAGGGGAGGGAGGAAAATGGATGAATGAG 17 75 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 7367 RTGAATCCTCCAGGCCWTTCTCTACACCCTGAAGGGGAGGGAGGAAAATGAATGAATGAG 7426 
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Query 17 76 AGAGGGAGGGAACAGTGCCCAAGCGCTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAG 1835 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7427 AAAGGGAGGGAACAGTACCCAAGCGCTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAG 7486 

Query 1836 GCTGGAAGATGGCAGCCCCCGGACTGGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGA 1895 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I II 
Sbjct 7487 GCTGGAAGATGGCAGCCCCCGGACTGGGCAGATCTTCAAGCAGACCTACAGCAAGTTYGA 7546 

Query 1896 CACAAAATCGCACAACGATGACGCACTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAG 1955 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7547 CACAAAMTCRCACAACGATGACGCACTRCTCAAGAACTACGGGCTGCTCTACTGCTTCAG 7606 

Query 1956 GAAGGACATGGACAAGGTCGAGACATTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGG 2 015 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7607 GAAGGACATGGACAAGGTCGAGACATTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGG 7666 

Query 2016 CAGCTGTGGCTTCTAGCTGCCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCT 2075 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7667 CAGCTGTGGCTTCTAGCTGCCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCT 7726 

Query 2076 GGTCGTGGAAGGTGCTACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCAT 2135 

II I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7727 GGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCAT 7786 

Query 2136 CATTTTGTTTGACTAGGTGTCCTTGTATAATATTATGGGGTGGAGGCGGGTGGTATGGAG 2195 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7787 CATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAG 7846 

Query 2196 CAAGGGGCCAGGTTGGGAAGACAACCTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGC 2255 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Sbjct 7847 CAAGGGGCAAG-TTGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATT-GGGAACCAAGC 7904 

Query 2256 TGGAGTGCAGTGGCAG — TCTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAAGCGATT 2313 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7905 TGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATT 7964 

Query 2314 CTCCTGCCTCAGTCTCCCGAATAGTTGCGATTCCAGGCATGCAAGACCAGGCTCAGCTAA 23 73 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 7965 CTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAA 8024 

Query 2374 TTTTTGTATTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGTCTGGTCTCCATCTCC 2433 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 8 025 TTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCAACTCC 8084 

Query 2 43 4 TGACCTCAGGTAATCCGCCCGCCTCGGCCTCCCAAATTGCTGGGATTACAGGTATGAGCC 2 493 

I I I I I I I I I III III III I I I I I I I I I I I I I I I I I I I I I I I I I I I III II 
Sbjct 8 0 85 TAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAAT TGCTGGGATTACAGGCGTGAACC 8144 

Query 2494 ACTGGGCCCTTCCCTGTCCTG-TGATTTTAAAATAATTATACCAGCAGAAGGACGTCCAG 2552 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 8145 ACTGCTCCCTTCCCTGTCCTTCTGATTTTAAAATAACTATACCAGCAGGAGGACGTCCAG 8204 

Query 2553 ACACAGCATGGGCTACCTGGCCATGCCCAGCCAGTTGGACATTTGAGTTGTTTGCTTGGC 2612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 82 05 ACACAGCATAGGCTACCTGGCCATGCCCAACCGGTGGGACATTTGAGTTGYTTGCTTGGC 826 4 

Query 2613 ACTGTCCTCTCATGCATTGGGTCCACTCAGTAGATGCTTGTTGAATTC 2660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 8265 ACTGTCCTCTCATGCGTTGGGTCCACTCAGTAGATGCCTGTTGAATTC 8312 
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Score = 1940 bits (1050), Expect = 0.0 
Identities = 1367/1518 (90%), Gaps = 39/1518 (2%) 
Strand=Plus/Plus 

Query 765 CAGCTCCTGGAACAGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTG-CCTCC 823 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 

Sbjct 2 86 71 CAGCTCCTGGAGCAGGGAGAGCGCTGGCCTCTTCCTCTCCGGCTCCCTCCATTGCCCTCC 2 8 730 

Query 824 GGTTTCTCCCCAGGCTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCC 883 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 

Sbjct 2 8 731 GGTTTCTCCCCAGGCTCCCGGACGTCCCTGCTCCTGGCTTTTGCCCTGCTCTGCCTGCCC 28790 

Query 884 TGGCTTCAAGAGGGC-AGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGC 9 42 

I I I I I I I I I I I III I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 8 791 TGGCTTCAAGA-GGCTGGTGCCGTCCAAACCGTTCCGTTATCCAGGCTTTTTGACCACGC 28849 

Query 9 43 TATGCTCCGCGCCCGTCGC-CTGTACCAGCTGG-CATATGACACCTATCAGGAGTTTGTA 1000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 8 850 TATGCTCCAAGCCCATCGCGC-GCACCAGCTGGCCAT-TGACACCTACCAGGAGTTTGTA 2 8907 

Query 1001 AGCTCTTGGGTAATGGGTGCGCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCT-G 1059 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Sbjct 2 8908 AGTTCTTGGGGAATGGGTGCGGGTCAGGGGTGGCAAGAAGGGGTGACTTTCCCCCACTGG 28967 

Query 106 0 GGAAGTAATGGGAGGAGACTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCA 1119 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 896 8 GGAAGTAATGGGAGGAGACTAAGGAGCTCAGGGTTGTTTTCTGAAGCGAAAATGCAGGCA 29 02 7 

Query 112 0 GATGAGCATACGCTGAGTGAGGTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCAT 1179 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 29 02 8 GATGAGCATAGGCTGAGCCAGGTTCCCAGAAAAGCAACAATGGGAGCTGGTCTCCAGCAT 29087 

Query 1180 AG-A C — CTTGGTGGGCGGTCCTTCTCCTAGGAAGAAGCCTATATCCTGA 1226 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 29088 AGAAACCAGCAGTCCTTCTTGGTGGGGGGTCCTTCTCCTAGGAAGAAACCTATATCCCAA 29147 

Query 122 7 AGGAGCAGAAGTATTCATTCCTGCA-GAACCCCCAGACCTCCCTCTGCTTCTCAGAGTCT 12 85 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I III 

Sbjct 29148 AGGACCAGAAGTATTCATTCCTGCATG-ACTCCCAGACCTCCTTCTGCTTCTCAGACTCT 292 06 

Query 12 86 ATTCCAACACCTTCCAACAGGGTGAAAACGCAGCAGAAATCTGTGAGTGGATGCCTTCTC 13 45 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 292 0 7 ATTCCGACACCCTCCAACATGGAGGAAACGCAACAGAAATCCGTGAGTGGATGCCGTCTC 29266 

Query 13 46 CCC-AGG-TGGGATGGGGTAGACCTGTGGTCAGAGCCCCCGGGCAGCACAGCCACTGCCG 14 03 

III III I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 29267 CCCTAGGCGGGGATGGGGGAGACCTGTGGTCAGGGCTCCCGGGCAGCACAGCCACTGCCG 29326 

Query 1404 GTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCTCCCTGCTGCTCATCCAGTCATGG 1463 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Sbjct 29327 GTCCTTCCCCTGCAGAATCTAGAGCTGCTCCGCATCTCCCTGCTGCTCATCGAGTCGTGG 29386 

Query 1464 CTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCAACAGCCTGGTGTATGGCGCCTCG 1523 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 29387 CTGGAGCCCGTGCGGTTCCTCAGGAGTATGTTCGCCAACAACCTGGTGTATGACACCTCG 29446 

Query 152 4 GACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGGAAGGCATCCAAACGCTGATGTGG 15 83 

I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Sbjct 29 447 GACAGCGATGACTATCACCTCCTAAAGGACCTAGAGGAAGGCATCCAAACGCTGATGGGG 29506 
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Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



1584 

29507 

1640 

29566 

1700 

29626 

1760 

29686 

1820 

29746 

1880 

29806 

1940 

29866 

2000 

29926 

2060 

29985 

2120 

30044 

2180 

30104 

2238 

30160 



GTGAGGGTGGCACCA-GGAT — CCAATCCTGGGGCCCCACTGGCTTCCAGGGACT-GGGG 
I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
GTGAGGGTGGCGCCAGGGGTCRCCAATCCTGGAACCCCACTGGCTTCGAGGG-CTGGGGG 

AGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGACCCAAGAGAACTCACCGTA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
AGAGAAATACTGCTGCCCTCTTTKTAGCAGTAAGGCGCTGACCCAAGAGAACTCACCTTA 

TTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTACAACCTGGAGGGGAGGGAGG 
I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTCTTCATTTCGCCTGGTGAATCCTCCAGGCCTTTCTCTACACCCTGAAGGGGAGGGAGG 

AAAATGGATGAATGAGAGAGGGAGGGAACAGTGCCCAAGCGCTTGGCCTCTCCTTCTCTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAAATGGATRAATGAGAGAGGGAGGGAACAGTGCCCAAGCGCTTGGCCTCTCCTTCTCTT 

CCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACTGGGCAGATCTTCAATCAGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
CCTTCACTTTGCAGAGGCTGGAAGACGGCAGCCGCCGGACTGGGCAGATCCTCAAGCAGA 

CCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCACTGCTCAAGAACTACGGGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTACAGCAAGTTTGACACAAACTCGCACAACCATGACGCACTGCTCAAGAACTACGGGC 

TGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACATTCCTGCGCATCGTGCAGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACATTCCTGCGCATGGTGCAGT 

GCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGGTGGCATCCCTGTGACCCCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
GCCGCTCTGTRGAGGGYAGCTGTGGCTTCTAGGTGCCCGMGTRGCATCC-TGTGACCCCT 

CCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTGCCCACCAGCCTTGTCCTAA 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCCAGTGCCTCTCCTGGCCCTG-AAGGTGCCACTCCAGTGCCCACCAGCCTTGTCCTAA 

TAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTGTATAATATTATGGGGTGGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
TAAAATTAAGTTGTATCATTTCATCTGACTAGGTGTCATTCTATAATATTATGGGGTGGA 

-GGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACA-ACCTGTAGGGCCTTCAGGG 
II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 
AGGTGG-TGGTATGGAGCAAGGGGT-AGGT-GGAAAGA-AGACCTGGAGGGCCTTCAAGG 

TCTATTCGGGAACCAGGC 2 2 55 
I I I I I I I I I I I I I I I I 
TCTATT-GGGAACTAGGC 30176 



Score = 1914 bits (1036), Expect = 0.0 
Identities = 1365/1522 (89%), Gaps = 42/1522 (2%) 
Strand=Plus/Plus 

Query 765 CAGCTCCTGGAACAGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTG-CCTCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 
Sbjct 51505 CAGCTCCTGGAGCAGGGAGAGCGCTGGCCTCTTCCTCTCCGGCTCCCTCCATTGCCCTCC 

Query 82 4 GGTTTCTCCCCAGGCTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 



1639 

29565 

1699 

29625 

1759 

29685 

1819 

29745 

1879 

29805 

1939 

29865 

1999 

29925 

2059 

29984 

2119 

30043 

2179 

30103 

2237 

30159 



823 

51564 

883 
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Sbjct 51565 GGTTTCTCCCCAGGCTCCCGGACGTCCCTGCTCCTGGCTTTTGCCCTGCTCTGCCTGCCC 51624 

Query 884 TGGCTTCAAGAGGGC-AGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGC 9 42 

I I I I I I I I I I I III I I I I I III I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 51625 TGGCTTCAAGA-GGCTGGTGCCGTCCAAACCGTTCCGTTATCCAGGCTTTTTGACCACGC 51683 

Query 9 43 TATGCTCCGCGCCCGTCGC-CTGTACCAGCTGG-CATATGACACCTATCAGGAGTTTGTA 1000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 516 8 4 TATGCTCCAAGCCCATCGCGC-GCACCAGCTGGCCAT-TGACACCTACCAGGAGTTTGTA 51741 

Query 1001 AGCTCTTGGGTAATGGGTGCGCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCT-G 1059 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Sbjct 51742 AGTTCTTGGGGAATGGGTGCGGGTCAGGGGTGGCAAGAAGGGGTGACTTTCCCCCACTGG 51801 

Query 106 0 GGAAGTAATGGGAGGAGACTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCA 1119 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 518 02 GGAAGTAATGGGAGGAGACTAAGGAGCTCAGGGTTGTTTTCTGAAGCGAAAATGCAGGCA 51861 

Query 112 0 GATGAGCATACGCTGAGTGAGGTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCAT 1179 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 51862 GATGAGCATAGGCTGAGCCAGGTTCCCAGAAAAGCAACAATGGGAGCTGGTCTCCAGCAT 51921 

Query 1180 AG-A C — CTTGGTGGGCGGTCCTTCTCCTAGGAAGAAGCCTATATCCTGA 1226 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 51922 AGAAACCAGCAGTCCTTCTTGGTGGGGGGTCCTTCTCCTAGGAAGAAACCTATATCCCAA 519 81 

Query 122 7 AGGAGCAGAAGTATTCATTCCTGCA-GAACCCCCAGACCTCCCTCTGCTTCTCAGAGTCT 12 85 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I III 

Sbjct 51982 AGGACCAGAAGTATTCATTCCTGCATG-ACTCCCAGACCTCCTTCTGCTTCTCAGACTCT 52040 

Query 12 86 ATTCCAACACCTTCCAACAGGGTGAAAACGCAGCAGAAATCTGTGAGTGGATGCCTTCTC 13 45 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 52041 ATTCCGACACCCTCCAACATGGAGGAAACGCAACAGAAATCCGTGAGTGGATGCCGTCTC 52100 

Query 13 46 CCC-AGG-TGGGATGGGGTAGACCTGTGGTCAGAGCCCCCGGGCAGCACAGCCACTGCCG 14 03 

III III I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 52101 CCCTAGGCGGGGATGGGGGAGACCTGTGGTCAGGGCTCCCGGGCAGCACAGCCACTGCCG 52160 

Query 1404 GTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCTCCCTGCTGCTCATCCAGTCATGG 1463 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Sbjct 52161 GTCCTTCCCCTGCAGAATCTAGAGCTGCTCCGCATCTCCCTGCTGCTCATCGAGTCGTGG 52220 

Query 1464 CTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCAACAGCCTGGTGTATGGCGCCTCG 1523 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 52221 CTGGAGCCCGTGCGGTTCCTCAGGAGTATGTTCGCCAACAACCTGGTGTATGACACCTCG 52280 

Query 152 4 GACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGGAAGGCATCCAAACGCTGATGTGG 15 83 

I I I I I I I I I I I I I II III I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II 

Sbjct 52281 GACAGCGATGACTATCACCTCCTAAAGGACCTAGAGGAAGGCATCCAAACGCTGATGGGG 52340 

Query 158 4 GTGAGGGTGGCACCA-GGAT — CCAATCCTGGGGCCCCACTGGCTTCCAGGGACT-GGGG 1639 

I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Sbjct 52341 GTGAGGGTGGCGCCAGGGGTCGCCAATCCTGGAACCCCACTGGCTTMGAGGG-CTGGGGG 52399 

Query 16 40 AGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGACCCAAGAGAACTCACCGTA 1699 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Sbjct 52400 AGAGAAAYACTGCTGCCCTCTTTGTAGCAGTMAGGCGCTGACCCAAGAGAACTCACCTTA 52459 

Query 1700 TTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTACAACCTGGAGGGGAGGGAGG 1759 
I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 52460 TTCTTCATTTCGCCTGGTGAATCCTCCAGGCCYTTCTCTACACCCTGAAGGGGAGGGAGG 52519 

Query 176 0 AAAATGGATGAATGAGAGAGGGAGGGAACAGTGCCCAAGCGCTTGGCCTCTCCTTCTCTT 1819 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 52520 AAAATGGATGAATGAGAGAGGGAGGGAACAGTGCCCAAGCGCTTGGCCTCTCCTTCTCTT 52579 

Query 182 0 CCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACTGGGCAGATCTTCAATCAGT 18 79 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Sbjct 52580 CCTTCACTTTGCAGAGGCTGGAAGACGGCAGCCGCCGGACTGGGCAGATCCTCAAGCAGA 52639 

Query 1880 CCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCACTGCTCAAGAACTACGGGC 1939 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 52640 CCTACAGCAAGTTTGACACAAACTCRCACAACCATGACGCACTGCTCAAGAACTACGGGC 52699 

Query 19 40 TGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACATTCCTGCGCATCGTGCAGT 1999 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 52700 TGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACATTCCTGCGCATGGTGCAGT 52759 

Query 2000 GCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGGTGGCATCCCTGTGACC— C 2 057 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 52 76 0 GCCGCTCTGTAGAGGGTAGCTGTGGCTTCTAGGTGCCCGCGTGGCATCC-TGTGACCGAC 52818 

Query 2 058 C — TCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTGCCCACCAGCCTTGTC 2115 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 52819 CCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGGTGCCACTCCAGTGCCCATCAGCCTTGTC 52878 

Query 2116 CTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTGTATAATATTATGGGG 2175 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Sbjct 52879 CTAATAAAATTAAGTTGTATCATTTCATCTGACTAGGTGTCATTCTATAATATTATGGGG 52938 

Query 2176 TGGA-GGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACA-ACCTGTAGGGCCTTC 2233 

I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Sbjct 52939 TGGAAGGTGG-TGGTATGGAGCAAGGGGT-AGGT-GGAAAGA-AGACCTGGAGGGCCTTC 52994 

Query 2234 AGGGTCTATTCGGGAACCAGGC 2255 

I I I I I I I I I I I I I I I I I I 
Sbjct 52995 AAGRTCTATT-GGGAACTAGGC 5:;(J15 



Score = 1879 bits (1017), Expect = 0.0 
Identities = 1359/1522 (89%), Gaps = 48/1522 (3%) 
Strand=Plus/Plus 



Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 



CAGCTCCTGGAACAGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTG-CCTCC 823 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 

CAGCTCCTGGAACAGGGAGAGTGCTGGCCTCTTGCTCTGCGGCTCCCT-TCTTGCCCTCC 140 43 

GGTTTCTCCCCAGGCTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCC 8 83 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

GGTTTCTCCCCAGGCTCCCGGACGTCCCTGCTCCTGGCTTTTGCCCTGCTCTGCCTGCCC 14103 

TGGCTTCAAGAGGGC-AGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACA-ACG 9 41 
I I I I I I I I I I I III I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGCTTCAAGA-GGCTGGTGCCGTCCAAACCGTTCCCTTATCCAGGCTTTTT-AAAGAGG 14161 

CTATGCTCCGCGCCCGTCGC-CTGTACCAGCTGG-CATATGACACCTATCAGGAGTTTGT 999 
I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 

CTATGCTCCAAGCCCATCGCGC-ACACCAGCTGGCCAT-TGACACCTACCAGGAGTTTAT 14219 

AAGCTCTTGGGTAATGGGTGCGCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCT- 105 8 
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Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 



14220 AAGCTCTTGGGGAATGGGTGCGGGTCAGGGGTGGCAAGAAGGGGTGACTTTCYCCCACTG 14279 

1059 GGGAAGTAATGGGAGGAGACTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGC 1118 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14280 GGGAAGTAATGGGAGGASACTAAGGAGCTCAGGGTTGTTTTCTGAAGYGAAAATGCAGGC 14339 

1119 AGATGAGCATACGCTGAGTGAGGTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCA 117 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14340 AGATGAGCATAGGCTGAGCCAGGTTCCCAGAAGAGTAACAGTGGGAGCTGGTCTCCAGCA 14399 

1179 T AG-A C — CTTGGTGGGCGGTCCTTCTCCTAGGAAGAAGCCTATATC-CT 1224 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 4 0 0 TAGAAAGCAGTGGTCCTTCTTGGTGGGGGGTCCTTCCCCTAGGAAGAAGCCTATATCAC- 14 45 8 

12 2 5 GAAGGAGCAGAAGTATTCATTCCTGCA-GAACCCCCAGACCTCCCTCTGCTTCTCAGAGT 12 83 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

14 459 AAAGGAACAGAAGTATTCATTCCTGCATG-ACTCCCAGACCTCCTTCTGCTTCTCAGACT 14517 

12 8 4 CTATTCCAACA-CCTTCCAACAGGGTGAAAACGCAGCAGAAATCTGTGAGTGGATGCCT- 13 41 

I I I I I I I III II I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I II 

14518 CTATTCCGACATCC-TCCAACATGGAGGAAACGCAGCAGAAATCCGTGAGTGGATG-CTG 14575 

13 42 TCTCCCC-AGG-TGGGATGGGGTAGACCTGTGGTCAGAGCCCCCGGGCAGCACAGCCACT 1399 

I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

145 76 TCTCCCCTAGGCGGGGATGGGGGAGACCTGTGGTCAGAGCCCCCGGGCAGCACAGCCACT 14635 

140 0 GCCGGTCCTTCCCCTGCAGAACCTAGAGCTGCTCCGCATCTCCCTGCTGCTCATCCAGTC 1459 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14636 GCCGGTCCTTCCCCTGCAGAACTTAGAGCTGCTCCACATCTCCCTGCTGCTCATCGAGTC 14695 

146 0 ATGGCTGGAGCCCGTGCAGCTCCTCAGGAGCGTCTTCGCCAACAGCCTGGTGTATGGCGC 1519 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14696 GCGGCTGGAGCCCGTGCGGTTCCTCAGGAGTACCTTCACCAACAACCTGGTGTATGACAC 14 755 

152 0 CTCGGACAGCAACGTCTATCGCCACCTGAAGGACCTAGAGGAAGGCATCCAAACGCTGAT 15 79 
I I I I I I I I I I I I I I I II III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 756 CTCGGACAGYGATGAMTATCACCTCCTAAAGGACCTAGAGGAAGGCATCCAAATGCTGAT 14 815 

15 8 0 GTGGGTGAGGGTGGCACCA-GGAT — CCAATCCTGGG-GCCCCACTGGCTTCCAGGGACT 1635 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

14 816 GGGGGTGAGGGTGGCACCAGGGGTCCCCAATCCTGGAAGCCC-ACTGGCTTCGAGGG-CT 14 8 73 

1636 GGGG-AGAGAAACACTGCTGCCCTCTTTTTAGCAGTCAGGCGCTGACCCAAGAGAACTCA 169 4 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

148 74 GGGGGAGAGAAACACTGCTGCCCTCTTTTCAGCAGTCAGGCGCTGACCCAAGAGAACTCA 14933 

1695 CCGTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTACAACCTGGAGGGGAG 175 4 

II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1493 4 CCWTATTCTTCATTTCCCCTCGTGAATCCTCCAGGCCTTTCTCTACACCCTGRAGGGGAA 14993 

1755 GGAGGAAAATGGATGAATGAGAGAGGGAGGGAACAGTGCCCAAGCGCTTGGCCTCTCCTT 1814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1499 4 GGAGGAAAATGGATAAATGAGAGAGGGAGGGAACAGTGCCCAAGCGCTTGGTCTCTCCTT 15 053 

1815 CTCTTCCTTCACTTTGCAGAGGCTGGAAGATGGCAGCCCCCGGACTGGGCAGATCTTCAA 18 7 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I 

15 05 4 CTCTTGCTTCACTTTGCAGAGGCTGGAAGACGGCAGCCACCTGACTGGGCAGACCCTCAA 15113 

18 75 TCAGTCCTACAGCAAGTTTGACACAAAATCGCACAACGATGACGCACTGCTCAAGAACTA 193 4 
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Sbjct 15114 GCAGACCTACAGCAAGTTTGACACAAACTCGCACAACCATGACGCACTGCTCAAGAACTA 15173 



Query 
Sbjct 



CGGGCTGCTCTACTGCTTCAGGAAGGACATGGACAAGGTCGAGACATTCCTGCGCATCGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
CGGGCTGCTCCACTGCTTCAGGAAGGACATGGACAAGGTCGAGACATTCCTGCGCATGGT 



Query 1995 GCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGCTGCCCGGGTGGCATCCCTGTGA 2 054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Sbjct 15234 GCAGTGCCGCTCTGTGGAGGGCAGCTGTGGCTTCTAGGGGCCCGCGTGGCATCC-TGTGA 15292 



Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



2 055 CCCCTCCCCAGTGCCTCTCCTGGTCGTGGAAGGTGCTACTCCAGTGCCCACCAGCCTTGT 
II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
152 93 CCYCTCCCCAGTGCCTCTCCTGGCCCTG-AAGGTGCCACTCCAGTGCCCACCAGCCTTGT 

2115 CCTAATAAAATTAAGTTGCATCATTTTGTTTGACTAGGTGTCCTTGTATAATATTATGGG 
I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
15352 CCTAATAAAATTAAGTTGTATTGTTTCATCTGACTAGGTGTCCTTCTATAATATTATGGG 

2175 GTGGA-GGCGGGTGGTATGGAGCAAGGGGCCAGGTTGGGAAGACAACCTGTAGGGCCTTC 
I I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
15 412 GTGGAAGGTGG-TGGTATGGAGCAAGGGGT-AGGT-GGRAAGACGACCTGGAGGGCCTTC 

2 23 4 AGGGTCTATTCGGGAACCAGGC 2255 

I I I I I I I I I I I I I I I I I I I I 
15 469 AGGGTCTATT-GGGAACTAGGC 15489 



Score = 1081 bits (585), Expect = 0.0 
Identities = 688/737 (93%), Gaps = 11/737 (1%) 
Strand=Plus/Plus 



Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



13290 

121 

13350 

181 

13409 

241 

13469 

301 

13529 

361 

13589 



GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAATTCAGGACTGAATCATGCTCACAACCCCCACAATCTATTGGCTGTGC-TTGGCCCCT 

TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGTTAAACATGCGGGGAGGAGGAAAG 

GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
GAATAGGATAGAGAGTGGGATGTGGTCGATAGGGGTCTCAAGGACTGG-CTATCCTGACA 

TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II 
TCCTTCTCCKCATTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACCTGAACC 

TTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACAA 
I I I I I I I I I I I I I I I I I I I I I I I I I III III I I I I I I I I I I I I I I I I I I I I I I I I I 
TTAAAGAGAGGACAAGTTGGGTGGTGTCTGTGGTTGACACTCTGTGCACAACCCTCACAA 

CGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGCTGGTGACGGTGGGAAGGGAAAGATGACAAGCCAGGGGACATGATGCCAGCATGTGTG 

GGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACATG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II 
GGAGGAGCTTCCAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCATGCATAAATGTG 



60 

13289 

120 

13349 

180 

13408 

240 

13468 

300 

13528 

360 

13588 

420 

13648 
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Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



421 CAGAGAAACAGGTGAGGAG-AAGCAGCGAGAGAGAAGGGGCCAGG-TATAAAAAGGGCCC 
II I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
136 49 CACAGAAACAGGTGGGG-GCAA-CAGCGAGAGAGAAGGGGCCAGGGTATAAAAAGGGCCC 

4 79 ACAAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGG 
I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
13 70 7 ACAAGAGACCAGCTCCAGCATCCCAAGGCCCGACTCCCCGCACCACTCAGGGTCCTGTGG 

539 ACAGCTCAC-TAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGG-CACAAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
13 76 7 ACAGCTCACCTAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGGGCACAAC 

59 7 GTGTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
13 82 7 GTGTCCTGAGGGGAGAGGCGGCGCCCTGCAGATGGGACGGGGGCACTAACC-TCAGGTTT 

65 7 GGGGCTTATGAATGTTAGCTATCGCCATCTAAGCCCAG-TATTTGGCCAATCTCTGAATG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
13 8 86 GGGGCTTCTGAATGTGAA-TATCGCCATCTAAGGCCAGATATTTGGCCAATCTCTGAATG 

716 TTCCTGGTCCCTGGAGG 732 

I I I I I I I I I I I I I I I I I 
13945 TTCCTGGTCCCTGGAGG 13961 



478 

13706 

538 

13766 

596 

13826 

656 

13885 

715 

13944 



Score = 1068 bits (578), Expect = 0.0 
Identities = 677/736 (91%), Gaps = 8/736 (1%) 
Strand=Plus/Plus 

Query 1 GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 
I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 566 0 GAATTCAGGACTGAATCGTGCTCACAACCCCCACAATCTATTGGCTGTGC-TTGGCCCCT 



Query 
Sbjct 



TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGTTAAACATGCGGGGAGGAGGAAAG 



Query 121 GAATAGGATAGAGAGTGGGATGGGGTCGGTA-GGGGTCTCAAGGACTGGCCTATCCTGAC 179 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 5779 GRATAGGATAGAGARTGGGATGKGGTCGGTAGGGGGTCTCAAGGACTGG-CTATCCTGAC 5837 



Query 
Sbjct 



ATCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATCCTTCKCCGCGTKCAGGTTGGCCACCATGGCCTGCDGCCAGAGGGCACCCACSTGACC 

CTTAAAGAGAGGACAAGTTGGGTGGTATCTCTGGCTGACATTCTGTGCACAACCCTCACA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTTAAAGAGAGGACAAGTTGGGTGGTATYTCTGGCTGACACTCTGTGCACAACCCTCACA 

ACGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGT 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACACTGGTGACGGTGGGAAGGGAAAGAYGACAAGCCAGGGGRCATGATSCCAGCATGTGT 



Query 
Sbjct 



GGGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
GGGAGGAGCTTCTAAATTATCCAYTAGCACAAGCCCGTCAGTGGCCCCATGCATAAATGT 



Query 42 0 GCAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGG-TATAAAAAGGGCCC 
II I I I I I I I I I I I II II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 6 0 78 RCACAGAAACAGGTGGGGKCAA-CAGTGGGAGAGAAGGGGCCAGGGTATAAAAAGGGCCC 
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Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 



479 ACAAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGG 538 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
613 7 ACAAGAGACCRGCTCHAGSATCCCAAGGCCCRACTCCCCGMACCACTCAGGGTCCTGTGG 6196 

539 ACAGCTCAC-TAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGG-CACAAT 596 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
619 7 ACAGCTCACCTAGCBGCAATGGCTRCAGGTAAGCGCCCCTAAAATCCCTTTGGGCACAAY 62 56 

59 7 GTGTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTT 656 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
62 5 7 GTGTCCTGAGGGGAGAGGCAGCGACCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTT 6316 

65 7 GGGGCTTATGAATGTTAGCTATCGCCATCTAAGCCCAGTATTTGGCCAATCTCTGAATGT 716 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
6317 GGGGCTTCTGAATGTGAG-TATCGCCATSTAAGCCCAGTATTTGKCCAATCTCAGAAAGC 63 75 

717 TCCTGGTCCCTGGAGG 732 

I I I I I I I I I I I I I I I I 
6376 TCCTGGTCCCTGGAGG 6391 



Score = 1037 bits (561), Expect = 0.0 
Identities = 680/737 (92%), Gaps = 9/737 (1%) 
Strand=Plus/Plus 



Query 
Sbjct 



GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 
I I I I I I I I III III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAATTCAGGACTCAATGGTGCTCAGAACCCCCACAATCTATTGGCTGTGC-TTGGCCCCT 



Query 61 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 12 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 79 72 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAAGTTAAACACGCGGGGAGGAGGAAAG 2 8 031 

Query 121 GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 8 032 GAATAGGATAGAGAGTGGAATGGGGTCGGTAGGGGTCTCAAGGACTGG-CTATCCTGACA 2 8 090 

Query 181 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 2 40 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2 8 091 GCCTTCCCCGCGTTCAGGTTGACCAACATGGCCTGCAGCCAGAGGGCACCCACCTGACCC 28150 

Query 2 41 TTAAAGAGAGGACAAGTTGGGTGGTA-TCTCTGGCTGACATTCTGTGCACAACCCTCACA 299 

I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I III III 

Sbjct 2 8151 TTAAAGAGAGGACAAGTTGGGTGG-AGTCTGTGGCTGACACTCTGTGCACAATCCTTACA 2 82 09 



Query 3 0 0 ACGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGT 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 2 8210 ACACTGGTGATGGTGAGAAGGGAAAGACGACAAGCCAGGGGGCATGATCCCAGCATGTGT 



Query 
Sbjct 



Sbjct 
Query 



GGGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
GGGAGGAGCTTCCAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCATGCATAAATGT 

GCAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGG-TATAAAAAGGGCCC 
II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACACAGAAACAGGTGGGGTCAAGCAGGGAGAGAGAACTGGCCAGGGTATAAAAAGGGCCC 

AC AAGAGACC AGCTCAAGGATCCCAAGGCCCAACTCCCCGAACC AC TCAGGGTCCTGTGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Sbjct 28390 ACAAGAGACCGGCTCTAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGG 28449 

Query 539 ACAGCTCAC-TAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGG-CACAAT 596 

I I I I I I I I I III III I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 28450 ACAGCTCACCTAGTGGCAATGGCTCCAGGTAAGCGCCCCTAAAATCCCTTTGGGCACAAC 28509 

Query 59 7 GTGTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTT 656 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 28510 GTGTCCTGAGGGGAGAGGCAGCGCCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTT 28569 

Query 657 GGGGCTTATGAATGTTAGCTATCGCCATCTAAGCCCAG-TATTTGGCCAATCTCTGAATG 715 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2 8570 GGGGCTTATGAATGTGAG-TATCGCCATCTAAGGCCAGATATTTGGCCAATCTCTGAATG 2 862 8 

Query 716 TTCCTGGTCCCTGGAGG 732 

I I I I I I I I I I I I I I I I 
Sbjct 28629 TTCCTGGTCTCTGGAGG 28645 



Score = 1037 bits (561), Expect = 0.0 
Identities = 680/737 (92%), Gaps = 9/737 (1%) 
Strand=Plus/Plus 



Query 
Sbjct 



GAATTCAGCACTGAATCATGCCCAGAACCCCCGCAATCTATTGGCTGTGCTTTGGCCCCT 
I I I I I I I I III III III I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
GAATTCAGGACTCAATGGTGCTCAGAACCCCCACAATCTATTGGCTGTGC-TTGGCCCCT 



Query 61 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAGGGGAAACATGCGGGGAGGAGGAAAG 12 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 50 8 06 TTTCCCAACACACACATTCTGTCTGGTGGGTGGAAGTTAAACACGCGGGGAGGAGGAAAG 50 865 

Query 121 GAATAGGATAGAGAGTGGGATGGGGTCGGTAGGGGTCTCAAGGACTGGCCTATCCTGACA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 50 866 GAATAGGATAGAGAGTGGAATGGGGTCGGTAGGGGTCTCAAGGACTGG-CTATCCTGACA 5092 4 

Query 181 TCCTTCTCCGCGTTCAGGTTGGCCACCATGGCCTGCTGCCAGAGGGCACCCACGTGACCC 2 40 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 50925 GCCTTCCCCGCGTTCAGGTTGACCAACATGGCCTGCAGCCAGAGGGCACCCACCTGACCC 509 8 4 

Query 2 41 TTAAAGAGAGGACAAGTTGGGTGGTA-TCTCTGGCTGACATTCTGTGCACAACCCTCACA 299 

I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I III III 

Sbjct 509 85 TTAAAGAGAGGACAAGTTGGGTGG-AGTCTGTGGCTGACACTCTGTGCACAATCCTTACA 510 43 

Query 300 ACGCTGGTGATGGTGGGAAGGGAAAGATGACAAGTCAGGGGGCATGATCCCAGCATGTGT 359 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 51044 ACACTGGTGATGGTGAGAAGGGAAAGACGACAAGCCAGGGGGCATGATCCCAGCATGTGT 51103 

Query 36 0 GGGAGGAGCTTCTAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCAGGCCTAAACAT 419 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Sbjct 51104 GGGAGGAGCTTCCAAATTATCCATTAGCACAAGCCCGTCAGTGGCCCCATGCATAAATGT 51163 

Query 42 0 GCAGAGAAACAGGTGAGGAGAAGCAGCGAGAGAGAAGGGGCCAGG-TATAAAAAGGGCCC 478 

II I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Sbjct 51164 ACACAGAAACAGGTGGGGTCAAGCAGGGAGAGAGAACTGGCCAGGGTATAAAAAGGGCCC 51223 

Query 479 ACAAGAGACCAGCTCAAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGG 538 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 51224 ACAAGAGACCGGCTCTAGGATCCCAAGGCCCAACTCCCCGAACCACTCAGGGTCCTGTGG 51283 

Query 539 ACAGCTCAC-TAGCGGCAATGGCTGCAGGTAAGCGCCCCTAAAATCCCTTTGG-CACAAT 596 
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I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 51284 ACAGCTCACCTAGTGGCAATGGCTCCAGGTAAGCGCCCCTAAAATCCCTTTGGGCACAAC 51343 

Query 59 7 GTGTCCTGAGGGGAGAGGCGGCGTCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTT 656 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 51344 GTGTCCTGAGGGGAGAGGCAGCGCCCTGTAGATGGGACGGGGGCACTAACCCTCAGGTTT 51403 

Query 657 GGGGCTTATGAATGTTAGCTATCGCCATCTAAGCCCAG-TATTTGGCCAATCTCTGAATG 715 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 51404 GGGGCTTATGAATGTGAG-TATCGCCATCTAAGGCCAGATATTTGGCCAATCTCTGAATG 51462 

Query 716 TTCCTGGTCCCTGGAGG 732 

I I I I I I I I I I I I I I I I 
Sbjct 51463 TTCCTGGTCTCTGGAGG 51479 



Score = 545 bits (295), Expect = 
Identities = 376/415 (90%), Gaps = 
Strand=Plus/Plus 



9-152 
/415 (1%) 



Query 2250 CCAGGCTGGAGTGCAGTGGCA-G-TCTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAA 2307 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 574 CCAGGCTAGAGTGCAATGGCACGATCTTGGCTCACTGCACCCTCCACCTCCTGGGTTCAA 633 

Query 23 0 8 GCGATTCTCCTGCCTCAGTCTCCCGAA-TAGTTGCGATTCCAGGCATGCAAGACCAGGCT 2366 

I I I I I I I I I I I I I I I I I I III I II III II I I I I II II II I I I I I I I I 
Sbjct 634 GCGATTCTCCTGCCTCAGCCTCTC-AAGTAGCTGGGATTACAAGCGCCCACTACCAGGCT 692 

Query 236 7 CAGCTAATTTTTGTATTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGTCTGGTCTC 2 426 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 693 CCGCTAATTTTTGTATTTTTAGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTC 752 

Query 2427 CATCTCCTGACCTCAGGTAATCCGCCCGCCTCGGCCTCCCAAATTGCTGGGATTACAGGT 2486 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 753 CAACTCCTGACCTCAGGTGATCCGCCCGCCTCGGCCTCCCAAATTGCTGGGATCACAGAT 812 

Query 2487 ATGAGCCACTGGGCCCTTCCCTGTCCT-GTGATTTTAAAATAATTATACCAGCAGAAGGA 2545 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 813 GTAAGCCACTGCGCCCTTCCCTGTCCTTGTCATTTTAAAATAATTATACCAGCAGGAGGA 8 72 

Query 2 5 46 CGTCCAGACACAGCATGGGCTACCTGGCCATGCCCAGCCAGTTGGACATTTGAGTTGTTT 26 05 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Sbjct 873 CGTCCAGACACAGCATGGGCTACCTGGCCATGCCCAGCTGGTTGGACATTTGAGTTCTTT 932 

Query 26 06 GCTTGGCACTGTCCTCTCATGCATTGGGTCCACTCAGTAGATGCTTGTTGAATTC 266 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 933 GCTTGGCACTGTCCTCTCATGCGTTGGGTCCACTCAGTAGATGCTTATTGAATTC 987 



Score = 209 bits (113), Expect = 8e-51 
Identities = 213/260 (81%), Gaps = 12/260 (4%) 
Strand=Plus/Plus 

Query 2 2 5 0 CCAGGCTGGAGTGCAGT-G-GCAGTCTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAA 
I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I 
Sbjct 41650 CCAGGCTGGAGTGCAGTGGCGCAATCTTGGCTCACAGCAACCTCTGCCTCCTGGGTTCAA 

Query 23 0 8 GCGATTCTCCTGCCTCAGTCTCCCGAA-TAGTTGCGATTCCAGGCA — TGCAAGACCAGG 
I I I I I I I I I I I I I I I I I I I I I I I II III II I I I I I III III I III I 
Sbjct 41710 GCGATTCTCCTGCCTCAGCCTCCC-AAGTAGCTGGGATTACGGGCTCGTGCCA — CCATG 
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Query 2365 CTCAGCTAATTTTTGTATTTTT-GGTAGAGACGGGGTTTCACCATATTGGCCAGTCTGGT 2 423 

I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I II II I I I I I 

Sbjct 41767 CCCAGCTAATTTTTGTATTTTTAGG-AGAGATGGAGTTTTGCCATGTGGGTTAGCCTGGT 41825 

Query 2424 CTC-CATCTCCTGACCTCAGGTAATCCGCCCGCCTCGGCCTCCCAAATTGCTGGGATTAC 2482 

II II I I I I I I I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 41826 CTTGCA-CTCCTGACCTTAAGTGATCCACCCACCTCAGCCTCCCAAAGTGCTGGGATTAT 41884 



Query 2483 AGGTATGAGCCACTGGGCCC 2502 

III I I I I I I I I I I I I I I 
Sbjct 418 85 AGGCATGAGCCACCGTGCCC 41904 



>gb|GC699295.1| Sequence 14540 from patent US 6812339 
Length=5692 

Score = 2802 bits (1517), Expect = 0.0 
Identities = 1780/1907 (93%), Gaps = 17/1907 (0%) 
Strand=Plus/Plus 

Query 765 CAGCTCCTGGAACAGGGAGAGCGCTGGCCTCTTGCTCTCCAGCTCCCTCTGTTG-CCTCC 823 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2313 CAGCTCCTGGAGCAGGGAGAGTGCTGGCCTCTTGCTCTCCGGCTCCCTCTGTTGCCCTCT 23 72 

Query 824 GGTTTCTCCCCAGGCTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGTCC 883 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Sbjct 2373 GGTTTCTCCCCAGGCTCCCGGACGTCCCTGCTCCTGGCTTTTGGCCTGCTCTGCCTGCCC 2432 

Query 884 TGGCTTCAAGAGGGCAGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCT 9 43 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2433 TGGCTTCAAGAGGGCAGTGCCTTCCCAACCATTCCCTTATCCAGGCTTTTTGACAACGCT 2492 

Query 944 ATGCTCCGCGCCCGTCGCCTGTACCAGCTGGCATATGACACCTATCAGGAGTTTGTAAGC 1003 

I I I I I I I I I I I I I III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2493 ATGCTCCGCGCCCATCGTCTGCACCAGCTGGCCTTTGACACCTACCAGGAGTTTGTAAGC 2552 

Query 1004 TCTTGGGTAATGGGTGCGCTTCAGAGGTGGCAGGAAGGGGTGAATTTCCCCCGCTGGGAA 1063 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2553 TCTTGGGGAATGGGTGCGCATCAGGGGTGGCAGGAAGGGGTGACTTTCCCCCGCTGGGAA 2612 

Query 106 4 GTAATG-GGAGGAGACTAAGGAGCTCAGGGTTGTTTTCTGAAGTGAAAATGCAGGCAGAT 1122 

III I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2613 ATAA-GAGGAGGAGACTAAGGAGCTCAGGGTT-TTTCCCGAAGCGAAAATGCAGGCAGAT 2670 

Query 1123 GAGCATACGCTGAGTGAGGTTCCCAGAAAAGTAACAATGGGAGCAGGTCTCCAGCATAGA 1182 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 26 71 GAGCACACGCTGAGTGAGGTTCCCAGAAAAGTAACAATGGGAGCTGGTCTCCAGCGTAGA 2 73 0 

Query 1183 CCTTGGTGGGCGGTCCTTCTCCTAGGAAGAAGCCTATATCCTGAAGGAGCAGAAGTATTC 12 42 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2 731 CCTTGGTGGGCGGTCCTTCTCCTAGGAAGAAGCCTATATCCCAAAGGAACAGAAGTATTC 2 79 0 

Query 1243 ATTCCTGCAGAACCCCCAGACCTCCCTCTGCTTCTCAGAGTCTATTCCAACACCTTCCAA 1302 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2791 ATTCCTGCAGAACCCCCAGACCTCCCTCTGTTTCTCAGAGTCTATTCCGACACCCTCCAA 2850 

Query 13 03 CAGGGTGAAAACGCAGCAGAAATCTGTGAGTGGATGCCTTCTCCCCAGG-TGGGATGGGG 1361 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 2 851 CAGGGAGGAAACACAACAGAAATCCGTGAGTGGATGCCTTCTCCCCAGGCGGGGATGGGG 2910 
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Query 1362 TAGACCTGTGGTCAGAGCCCCCGGGCAGCACAGCCACTGCCGGTCCTTCCCCTGCAGAAC 1421 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 2911 GAGACCTGTAGTCAGAGCCCCCGGGCAGCACAGCCAATGCCCGTCCTTCCCCTGCAGAAC 29 70 

Query 1422 CTAGAGCTGCTCCGCATCTCCCTGCTGCTCATCCAGTCATGGCTGGAGCCCGTGCAGCTC 1481 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Sbjct 2971 CTAGAGCTGCTCCGCATCTCCCTGCTGCTCATCCAGTCGTGGCTGGAGCCCGTGCAGTTC 3030 

Query 1482 CTCAGGAGCGTCTTCGCCAACAGCCTGGTGTATGGCGCCTCGGACAGCAACGTCTATCG- 1540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3031 CTCAGGAGTGTCTTCGCCAACAGCCTGGTGTACGGCGCCTCTGACAGCAACGTCTAT-GA 3089 

Query 1541 CCACCTGAAGGACCTAGAGGAAGGCATCCAAACGCTGATGTGGGTGAGGGTGGCACCA-G 1599 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
Sbjct 3090 CCTCCTAAAGGACCTAGAGGAAGGCATCCAAACGCTGATGGGGGTGAGGGTGGCGCCAGG 3149 

Query 16 0 0 GAT — CCAATCCTGGGGCCCCACTGGCTTCCAGGGACTG-GGGAGAGAAACACTGCTGCC 1656 

I I I I I I I I I I I I I I I I I I I I I III II I III I I I I I I I I I I I I I I I I I I 

Sbjct 3150 GGTCCCCAATCCTGGAGCCCCACTGACTTTGAGAG-CTGTGTTAGAGAAACACTGCTGCC 32 0 8 

Query 1657 CTCTTTTTAGCAGTCAGGCGCTGACCCAAGAGAACTCACCGTATTCTTCATTTCCCCTCG 1716 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 32 09 CTCTTTTTAGCAGTCAGGCCCTGACCCAAGAGAACTCACCTTATTCTTCATTTCCCCTCG 326 8 

Query 1717 TGAATCCTCCAGGCCTTTCTCTACAACCTGGAGGGGAGGGAGGAAAATGGATGAATGAGA 17 76 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3269 TGAATCCTCCAGGCCTTTCTCTACACCCTGAAGGGGAGGGAGGAAAATGAATGAATGAGA 3328 

Query 1777 GAGGGAGGGAACAGTGCCCAAGCGCTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGG 1836 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3329 AAGGGAGGGAACAGTACCCAAGCGCTTGGCCTCTCCTTCTCTTCCTTCACTTTGCAGAGG 3388 

Query 183 7 CTGGAAGATGGCAGCCCCCGGACTGGGCAGATCTTCAATCAGTCCTACAGCAAGTTTGAC 1896 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I III 

Sbjct 33 89 CTGGAAGATGGCAGCCCCCGGACTGGGCAGATCTTCAAGCAGACCTACAGCAAGTTCGAC 3 448 

Query 189 7 ACAAAATCGCACAACGATGACGCACTGCTCAAGAACTACGGGCTGCTCTACTGCTTCAGG 1956 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3449 ACAAACTCACACAACGATGACGCACTACTCAAGAACTACGGGCTGCTCTACTGCTTCAGG 3508 

Query 1957 AAGGACATGGACAAGGTCGAGACATTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGC 2 016 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3509 AAGGACATGGACAAGGTCGAGACATTCCTGCGCATCGTGCAGTGCCGCTCTGTGGAGGGC 3568 

Query 2017 AGCTGTGGCTTCTAGCTGCCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTG 2 0 76 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3569 AGCTGTGGCTTCTAGCTGCCCGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTG 3628 

Query 2077 GTCGTGGAAGGTGCTACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATC 2136 

I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3629 GCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATC 36 8 8 

Query 213 7 ATTTTGTTTGACTAGGTGTCCTTGTATAATATTATGGGGTGGAGGCGGGTGGTATGGAGC 2196 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 36 89 ATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGC 3 748 

Query 219 7 AAGGGGCCAGGTTGGGAAGACAACCTGTAGGGCCTTCAGGGTCTATTCGGGAACCAGGCT 2 2 56 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Sbjct 3749 AAGGGGCAAG-TTGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATT-GGGAACCAAGCT 3806 
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Query 2257 GGAGTGCAGTGGCAG — TCTTGGCTCGCTGCAATCTCCGCCTCCTGGGTTCAAGCGATTC 2314 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3807 GGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTC 3 866 

Query 2315 TCCTGCCTCAGTCTCCCGAATAGTTGCGATTCCAGGCATGCAAGACCAGGCTCAGCTAAT 23 7 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 3 86 7 TCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAAT 3926 

Query 23 75 TTTTGTATTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGTCTGGTCTCCATCTCCT 2 43 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 392 7 TTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCAACTCCT 39 86 

Query 2435 GACCTCAGGTAATCCGCCCGCCTCGGCCTCCCAAATTGCTGGGATTACAGGTATGAGCCA 2494 

I I I I I I I I III III III I I I I I I I I I I I I I I I I I I I I I I I I I I I III III 

Sbjct 3987 AATCTC AGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACC A 4046 

Query 2495 CTGGGCCCTTCCCTGTCCTG-TGATTTTAAAATAATTATACCAGCAGAAGGACGTCCAGA 2553 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 40 47 CTGCTCCCTTCCCTGTCCTTCTGATTTTAAAATAACTATACCAGCAGGAGGACGTCCAGA 4106 

Query 2 55 4 CACAGCATGGGCTACCTGGCCATGCCCAGCCAGTTGGACATTTGAGTTGTTTGCTTGGCA 2 613 

I I I I I I I I I I I I I I I I I I I I I II I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I 

Sbjct 410 7 CACAGCATAGGCTACCTGGCCATGCCCAACCGGTGGGACATTTGAGTTGTTTGCTTGGCA 4166 

Query 2614 CTGTCCTCTCATGCATTGGGTCCACTCAGTAGATGCTTGTTGAATTC 266 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Sbjct 4167 CTGTCCTCTCATGCGTTGGGTCCACTCAGTAGATGCCTGTTGAATTC 4213 



Database: Nucleotide sequences derived from the Patent division of GenBank 

Posted date: Mar 1, 2009 2:34 AM 
Number of letters in database: 537,266,521 
Number of sequences in database: 8,753,385 

Lambda K H 

1.33 0.621 1.12 
Gapped 

Lambda K H 

1.28 0.460 0.850 
Matrix: blastn matrix: 1 -2 

Gap Penalties: Existence: 0, Extension: 0 

Number of Sequences: 8753385 

Number of Hits to DB: 1394086 

Number of extensions: 628 

Number of successful extensions: 628 

Number of sequences better than 10: 419 

Number of HSP ' s better than 10 without gapping: 0 

Number of HSP ' s gapped: 6 03 

Number of HSP ' s successfully gapped: 603 

Length of query: 2660 

Length of database: 4832233817 

Length adjustment: 32 

Effective length of query: 2628 

Effective length of database: 4552125497 

Effective search space: 11962985806116 

Effective search space used: 11962985806116 

A: 0 

XI: 12 (23.1 bits) 



)://blast.ncbi.nlm.nih.gov/Blast.c 
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X2: 32 (59.1 bits) 

X3: 54 (99.7 bits) 

SI: 12 (23.3 bits) 

S2: 22 (41.7 bits) 
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